Sie sind hier
E-Book

Data Warehouse Technologien

AutorGunter Saake, Kai-Uwe Sattler, Veit Köppen
Verlagmitp Verlags GmbH & Co. KG
Erscheinungsjahr2014
Seitenanzahl338 Seiten
ISBN9783826695889
FormatPDF
Kopierschutzkein Kopierschutz/DRM
GerätePC/MAC/eReader/Tablet
Preis25,99 EUR
  • Architekturprinzipien von Data-Warehouse-Systemen
  • Datenstrukturen und Algorithmen
  • Anwendungsfeld Business Intelligence
Dieses Lehrbuch behandelt Konzepte und Techniken von Data-Warehouse-Systemen, die eine wesentliche Komponente in betrieblichen Entscheidungsprozessen darstellen. Im Mittelpunkt stehen dabei Architekturprinzipien sowie die Umsetzung des multidimensionalen Datenwürfels als zentrale Komponente des Data Warehouse. Die Zusammenführung der Daten aus verschiedenen betrieblichen und externen Quellen spielt eine ebenso wichtige Rolle wie Datenstrukturen und Algorithmen für die Realisierung von Speicher- und Indexstrukturen. Die Navigation im Datenwürfel und die Anfrageverarbeitung sowie Anwendungen aus dem Themenfeld Business Intelligence geben einen Einblick in den Umgang mit dem Data Warehouse.Detailliert werden sowohl der Aufbau als auch die Nutzung von Data-Warehouse-Systemen beleuchtet. Dabei stehen Modellierungskonzepte und die Thematik der multidimensionalen Anfragen im Vordergrund. Zudem werden Interna wichtiger Systemlösungen von Oracle, IBM und Microsoft anhand zahlreicher Beispiele erläutert.Das Buch fokussiert auf relationale Umsetzungsstrategien des Data Warehouse. Es ist daher empfehlenswert, sich ebenfalls mit den Grundlagenwerken Datenbanken - Konzepte und Sprachen sowie Datenbanken - Implementierungstechniken auseinanderzusetzen; sie erlauben es dem Leser, die Konzepte aus Datenbanken für das Data Warehouse leichter zu transferieren. Das Buch ist geeignet für Studierende der Informatik oder verwandter Fächer im Masterbereich und bietet gleichzeitig auch dem Anwender bzw. Entwickler vertiefende Hintergrundinformationen zu aktuellen Data-Warehouse-Technologien.Die Autoren lehren und forschen im Bereich Datenbanken und Informationssysteme sowie Business Intelligence - Veit Köppen und Gunter Saake an der Universität Magdeburg und Kai-Uwe Sattler an der TU Ilmenau.
    Aus dem Inhalt:
  • Data Warehousing
  • Architekturkonzepte
  • Extraktion, Transformation und Laden
  • Datenqualität
  • Business Intelligence
  • Modellierung
  • Multidimensionales Modell
  • Relationale Umsetzung
  • Star- und Snowflake-Schema
  • Slowly Changing Dimensions
  • Speicher- und Indexstrukturen
  • ROLAP und MOLAP
  • Partitionierung
  • Row Stores, Column Stores und In-MemoryBitmap-Indexe
  • Mehrdimensionale Indexstrukturen
  • Data Warehouse:Anfragen und Verarbeitung
  • OLAP-Anfrage-operatoren
  • SQL-Operatoren im Data Warehouse
  • Anfrageplanung
  • Materialisierte Sichten


Die Autoren lehren und forschen im Bereich Datenbanken und Informationssysteme sowie Business Intelligence - Veit Köppen und Gunter Saake an der Universität Magdeburg und Kai-Uwe Sattler an der TU Ilmenau.

Kaufen Sie hier:

Horizontale Tabs

Blick ins Buch
Inhaltsverzeichnis
Cover1
Titel3
Impressum4
Inhaltsverzeichnis9
1 Einführung in Data-Warehouse-Systeme15
1.1 Anwendungsszenario Getränkemarkt16
1.2 OLTP versus OLAP18
1.2.1 OLAP- versus OLTP-Transaktionen19
1.2.2 Vergleich von OLTP und OLAP20
1.2.3 Abgrenzung: DBMS-Techniken21
1.3 Charakteristika und Begriffe22
1.4 Big Data und Data Warehousing23
1.5 Aufbau des Buches25
1.6 Vertiefende Literatur27
1.7 Übungen28
2 Architektur29
2.1 Anforderungen29
2.1.1 Grobe Übersicht über Data-Warehouse-Systeme29
2.1.2 Anforderungen an die Architektur31
2.1.3 Die 12 OLAP-Regeln nach Codd32
2.1.4 Die FASMI-Anforderungen35
2.2 Datenfluss in einem Data-Warehouse-System36
2.2.1 Phasen des Data Warehousing36
2.2.2 Datenquellen37
2.2.3 Datenbereinigungsbereich40
2.2.4 Extraktionskomponenten41
2.2.5 Transformationskomponenten41
2.2.6 Ladekomponente43
2.2.7 Basisdatenbank43
2.2.8 Befüllen43
2.2.9 Der Datenwürfel44
2.2.10 Data Marts44
2.2.11 Das Data Warehouse45
2.3 Referenzarchitektur45
2.3.1 Data-Warehouse-Manager46
2.3.2 Monitore47
2.3.3 Repository49
2.3.4 Metadaten-Manager49
2.3.5 Diskussion der kompletten Referenzarchitektur49
2.4 Architektur des Data Warehouse50
2.4.1 Rolle der Data Marts50
2.4.2 Abhängige Data Marts: Nabe und Speiche51
2.4.3 Unabhängige Data Marts52
2.4.4 Föderierte und virtuelle Datenwürfel53
2.4.5 Data-Warehouse-Architektur in der Praxis53
2.4.6 Ein Multi-Schichten-Architekturansatz54
2.5 Vertiefende Literatur57
2.6 Übungen58
3 Modellierung von Data Warehouses59
3.1 Das multidimensionale Datenmodell59
3.1.1 Grundbegriffe59
3.1.2 Dimensionen61
3.1.3 Fakten und Kennzahlen62
3.1.4 Schema des multidimensionalen Datenwürfels64
3.2 Konzeptuelle Modellierung66
3.2.1 Das ME/R-Modell67
3.2.2 ADAPT68
3.3 Relationale Umsetzung70
3.3.1 Prinzip der relationalen Abbildung70
3.3.2 Snowflake-Schema71
3.3.3 Star-Schema73
3.3.4 Vergleich von Snowflake- und Star-Schema74
3.3.5 Fact-Constellation-Schema und Galaxie-Schema75
3.3.6 Alternative Modellierung von Klassifikationshierarchien78
3.3.7 Vermeidung von Semantikverlusten79
3.4 Slowly Changing Dimensions81
3.4.1 Berichtsanforderungen im Data Warehouse83
3.4.2 Typdefinitionen nach Kimball86
3.4.3 Realisierungen im Data Warehouse88
3.5 Vertiefende Literatur93
3.6 Übungen94
4 Extraktions-, Transformations- und Ladeprozess95
4.1 Qualitätsaspekte96
4.1.1 Der Datenbereinigungsprozess98
4.1.2 Duplikaterkennung102
4.1.3 Vergleichsfunktionen104
4.1.4 Beheben von Datenkonflikten110
4.2 Der ETL-Prozess111
4.3 Die Extraktionsphase113
4.3.1 Extraktionstechniken114
4.3.2 Methode des Differential Snapshot115
4.4 Die Transformationsphase119
4.4.1 Daten- und Schemakonflikte121
4.4.2 Mappings im Transformationsschritt123
4.5 Die Ladephase127
4.5.1 Verwendung des Oracle SQL-Loader128
4.5.2 Multi-Table-Insert130
4.6 Alternativer Ansatz: ELT132
4.7 Vertiefende Literatur133
4.8 Übungen134
5 Anfragen an Data-Warehouse-Datenbanken137
5.1 Einführung und Anforderungen137
5.2 OLAP-Operationen139
5.3 SQL-Operationen für das Data Warehouse142
5.3.1 Relationale Umsetzung multidimensionaler Anfragen142
5.3.2 CUBE und ROLLUP148
5.3.3 OLAP-Funktionen in SQL:2003152
5.4 MDX159
5.5 Vertiefende Literatur165
5.6 Übungen166
6 Speicherung167
6.1 Speicherung des Datenwürfels: Array vs. Relationen167
6.1.1 Relationale Implementierung – ROLAP168
6.1.2 Implementierung als Array – MOLAP170
6.1.3 Vergleich ROLAP und MOLAP-Speicherung174
6.1.4 Hybride Speicherung – HOLAP177
6.1.5 Alternative Speicherungsformen178
6.2 Partitionierung181
6.2.1 Partitionierung in relationalen Datenbanken181
6.2.2 Partitionierung in Data Warehouses184
6.2.3 Partitionierung von Datenwürfeln185
6.3 Spaltenorientierte Datenhaltung190
6.3.1 Basisideen der spaltenorientierten Datenhaltung190
6.3.2 Operationen und Anfragen in spaltenorientierter Datenhaltung191
6.3.3 Speichervarianten in spaltenorientierter Datenhaltung193
6.4 Hauptspeicherdatenbanken199
6.4.1 Was sind Hauptspeicherdatenbanken?199
6.4.2 Technologien aktueller Hauptspeicherdatenbanken201
6.4.3 Komprimierung von Daten202
6.4.4 Delta-Relationen204
6.5 Vertiefende Literatur205
6.6 Übungen206
7 Indexstrukturen209
7.1 Klassifikation von Indexstrukturen209
7.2 B-Bäume und Varianten212
7.2.1 Der B+-Baum213
7.2.2 Degenerierte B-Bäume214
7.2.3 Ordnungsabhängigkeit in B-Bäumen215
7.2.4 B+-Baum-Tricks: Oversized Index216
7.2.5 B+-Baum-Tricks: Berechnete Indexe217
7.3 Bitmap-Indexe217
7.3.1 Prinzip von Bitmap-Indexen218
7.3.2 Bitmap-Index: Realisierung219
7.3.3 Standard-Bitmap-Index220
7.3.4 Mehrkomponenten-Bitmap-Index221
7.3.5 Bereichskodierter Bitmap-Index222
7.3.6 Mehrkomponenten-bereichskodierter Bitmap-Index222
7.3.7 Intervallkodierte Indexierung224
7.3.8 Auswahl von Bitmap-Indexstrukturen225
7.4 Verbundindexe226
7.4.1 Prinzip des Verbundindex226
7.4.2 Bitmap-Verbundindex227
7.5 Mehrdimensionale Indexstrukturen228
7.5.1 Grid-File228
7.5.2 Mehrdimensionales Hashen MDH230
7.5.3 KdB-Baum231
7.5.4 R-Bäume232
7.5.5 Varianten von R-Bäumen234
7.5.6 Der UB-Baum235
7.6 Indexierung von Hierarchien240
7.6.1 Kodierung von Hierarchien240
7.6.2 Mehrdimensionales hierarchisches Clustering241
7.7 Vertiefende Literatur242
7.8 Übungen243
8 Anfrageverarbeitung und materialisierte Sichten245
8.1 Anfrageplanung245
8.1.1 Überblick246
8.1.2 Star-Join-Optimierung248
8.2 Berechnung des CUBE-Operators251
8.3 Materialisierte Sichten255
8.3.1 Anfragebeantwortung mit materialisierten Sichten256
8.3.2 Auswahl materialisierter Sichten264
8.3.3 Aktualisierung materialisierter Sichten266
8.3.4 Materialisierte Sichten in aktuellen DBMS271
8.4 Vertiefende Literatur274
8.5 Übungen275
9 Business-Intelligence-Anwendungen277
9.1 Business Intelligence278
9.1.1 Begriffsklärung278
9.1.2 Knowledge Discovery282
9.1.3 Datenanalyse285
9.2 Reporting286
9.2.1 Balanced Scorecard289
9.2.2 Navigation im Datenwürfel für Ad-hoc-Reporting291
9.3 Data Mining im BI-Umfeld293
9.3.1 Warenkorbanalyse295
9.3.2 Kunden-Clustering303
9.3.3 Klassifikationsverfahren307
9.3.4 Zeitreihenanalyse & Prognose311
9.3.5 Data Mining Extensions313
9.4 Vertiefende Literatur315
9.5 Übungen316
Abbildungsverzeichnis319
Tabellenverzeichnis325
Sachindex326
Literaturverzeichnis333

Weitere E-Books zum Thema: Netzwerke - Clouds - Datenbanken

Sichere Netzwerkkommunikation

E-Book Sichere Netzwerkkommunikation
Grundlagen, Protokolle und Architekturen Format: PDF

Netzwerke werden in allen Bereichen der IT eingesetzt, und es gibt zahlreiche Technologien zur sicheren Netzwerkkommunikation. Doch welche der verfügbaren Techniken lassen sich kombinieren und in der…

Sichere Netzwerkkommunikation

E-Book Sichere Netzwerkkommunikation
Grundlagen, Protokolle und Architekturen Format: PDF

Netzwerke werden in allen Bereichen der IT eingesetzt, und es gibt zahlreiche Technologien zur sicheren Netzwerkkommunikation. Doch welche der verfügbaren Techniken lassen sich kombinieren und in der…

Sichere Netzwerkkommunikation

E-Book Sichere Netzwerkkommunikation
Grundlagen, Protokolle und Architekturen Format: PDF

Netzwerke werden in allen Bereichen der IT eingesetzt, und es gibt zahlreiche Technologien zur sicheren Netzwerkkommunikation. Doch welche der verfügbaren Techniken lassen sich kombinieren und in der…

Sichere Netzwerkkommunikation

E-Book Sichere Netzwerkkommunikation
Grundlagen, Protokolle und Architekturen Format: PDF

Netzwerke werden in allen Bereichen der IT eingesetzt, und es gibt zahlreiche Technologien zur sicheren Netzwerkkommunikation. Doch welche der verfügbaren Techniken lassen sich kombinieren und in der…

Microsoft ISA Server 2006

E-Book Microsoft ISA Server 2006
Leitfaden für Installation, Einrichtung und Wartung Format: PDF

Im Januar 2005 ist mein erstes Buch zum Thema ISA Server 2004 erschienen. Die Erstauflage war bereits nach wenigen Monaten ausverkauft, was offensichtlich bedeutet, dass der Bedarf nach Informationen…

Microsoft ISA Server 2006

E-Book Microsoft ISA Server 2006
Leitfaden für Installation, Einrichtung und Wartung Format: PDF

Im Januar 2005 ist mein erstes Buch zum Thema ISA Server 2004 erschienen. Die Erstauflage war bereits nach wenigen Monaten ausverkauft, was offensichtlich bedeutet, dass der Bedarf nach Informationen…

Veritas Storage Foundation®

E-Book Veritas Storage Foundation®
High End-Computing für UNIX, Design und Implementation von Hochverfügbarkeitslösungen mit VxVM und VCS Format: PDF

Hochkonzentrierter und praxisorientierter Kurs zur 'Veritas Storage Foundation': Storage Virtualisierung (Teil 1) erzeugt virtuelle Diskspeicher, die bei Kompatibilität zu ihren physischen…

Veritas Storage Foundation®

E-Book Veritas Storage Foundation®
High End-Computing für UNIX, Design und Implementation von Hochverfügbarkeitslösungen mit VxVM und VCS Format: PDF

Hochkonzentrierter und praxisorientierter Kurs zur 'Veritas Storage Foundation': Storage Virtualisierung (Teil 1) erzeugt virtuelle Diskspeicher, die bei Kompatibilität zu ihren physischen…

Veritas Storage Foundation®

E-Book Veritas Storage Foundation®
High End-Computing für UNIX, Design und Implementation von Hochverfügbarkeitslösungen mit VxVM und VCS Format: PDF

Hochkonzentrierter und praxisorientierter Kurs zur 'Veritas Storage Foundation': Storage Virtualisierung (Teil 1) erzeugt virtuelle Diskspeicher, die bei Kompatibilität zu ihren physischen…

Weitere Zeitschriften

Computerwoche

Computerwoche

Die COMPUTERWOCHE berichtet schnell und detailliert über alle Belange der Informations- und Kommunikationstechnik in Unternehmen – über Trends, neue Technologien, Produkte und Märkte. IT-Manager ...

Courier

Courier

The Bayer CropScience Magazine for Modern AgriculturePflanzenschutzmagazin für den Landwirt, landwirtschaftlichen Berater, Händler und generell am Thema Interessierten, mit umfassender ...

Demeter-Gartenrundbrief

Demeter-Gartenrundbrief

Einzige Gartenzeitung mit Anleitungen und Erfahrungsberichten zum biologisch-dynamischen Anbau im Hausgarten (Demeter-Anbau). Mit regelmäßigem Arbeitskalender, Aussaat-/Pflanzzeiten, Neuigkeiten ...

dental:spiegel

dental:spiegel

dental:spiegel - Das Magazin für das erfolgreiche Praxisteam. Der dental:spiegel gehört zu den Top 5 der reichweitenstärksten Fachzeitschriften für Zahnärzte in Deutschland (laut LA-DENT 2011 ...

SPORT in BW (Württemberg)

SPORT in BW (Württemberg)

SPORT in BW (Württemberg) ist das offizielle Verbandsorgan des Württembergischen Landessportbund e.V. (WLSB) und Informationsmagazin für alle im Sport organisierten Mitglieder in Württemberg. ...

dima

dima

Bau und Einsatz von Werkzeugmaschinen für spangebende und spanlose sowie abtragende und umformende Fertigungsverfahren. dima - die maschine - bietet als Fachzeitschrift die Kommunikationsplattform ...

VideoMarkt

VideoMarkt

VideoMarkt – besser unterhalten. VideoMarkt deckt die gesamte Videobranche ab: Videoverkauf, Videoverleih und digitale Distribution. Das komplette Serviceangebot von VideoMarkt unterstützt die ...