Sie sind hier
E-Book

Data Profiling mit Eclipse. Von den Grundlagen zum Prototypen

AutorBjörn Knebel
VerlagDiplomica Verlag GmbH
Erscheinungsjahr2009
Seitenanzahl108 Seiten
ISBN9783836621229
FormatPDF
Kopierschutzkein Kopierschutz/DRM
GerätePC/MAC/eReader/Tablet
Preis43,00 EUR
Der erste Teil des Buches hat zum Ziel, eine Einführung in die Datenqualitätsanalyse zu geben und die Materie Data Profiling fundiert zu erläutern. Die zweite Hälfte beschäftigt sich mit der Konzeption und prototypischen Implementierung eines Data-Profiling-Werkzeugs auf Grundlage des Eclipse Modeling Frameworks. Die zentrale funktionale Eigenschaft der Lösung soll ein generiertes grafisches Datenmodell sein, das den Ausgangspunkt für typische Data-Profiling-Funktionen bildet. Aber auch der Entwicklungsprozess soll innovativen Charakter haben. So wird das Domänenmodell der Anwendung mithilfe des Eclipse Modeling Frameworks entworfen und in Programmcode transformiert. Der Diagrameditor wird über das Graphical Modeling Framework von Eclipse modelliert und generiert. Die Data-Profiling-Methoden werden per deskriptiver Schnittstellenerweiterung eingebunden.Die Lösung, der eher technisch/methodisch orientierten Problemstellung, wird mit den theoretischen Grundlagen der Datenqualität, einer ökonomischen Betrachtung und den potentiellen Anwendungsgebieten eingeleitet. Data-Profiling bildet dann den Schwerpunkt des zweiten Kapitels. Nachdem die Definition aus diversen Literaturquellen hergeleitet ist, wird das Vorgehensmodell dargestellt und die einzelnen Analysemethoden beschrieben und systematisiert.Anschließend wird die Systemumgebung thematisiert. Das Kapitel ist in eine Beschreibung der Eclipse-Plattform, eine Darstellung des modellbasierten Entwicklungsansatzes mit Eclipse und eine Analyse des Eclipse Modeling Frameworks unterteilt. Als Inspirationsquelle für das Werkzeugkonzept wurde eine Evaluation existierender Data-Profiling-Tools vorgenommen. Die letzten beiden Kapitel beschäftigen sich mit dem Entwurf und der Implementierung des Data-Profiling-Tools. Dargestellt sind unter andrem die modellgetriebene Entwicklung des Diagrammeditors, die Komponentenarchitektur, Aspekte der Pluginentwicklung unter Eclipse und die Implementierung ausgewählter Data-Profiling-Analysemethoden.

Kaufen Sie hier:

Horizontale Tabs

Leseprobe
Kapitel 4.2.4 Zukunft der Modellierung in Eclipse

Bis zum heutigen Tag wurde eine Vielzahl an modellbasierten Werkzeugen, Plattformen und Prozessen veröffentlicht, die leider in den meisten Fällen zueinander inkompatibel sind und sich erst recht keinem ganzheitlichen integrativen Standardprozess verschreiben. Viele Projekte befassen sich nur mit einem Teilbereich der modellgetriebenen Softwareentwicklung und entwickelten sich im Laufe der Zeit ausschließlich im eigenen Umfeld weiter. Die Eclipse Organisation versucht nun die internen Projekte zu vereinheitlichen und neu auszurichten, um sie in einem allumfassenden Top-Level-Projekt namens Eclipse Modeling Project zu bündeln. Weiterhin werden Vorschläge für eine bessere Integration externer Tools gemacht. Die folgenden Punkte beschreiben Inhalte des Projekts und stellen die wichtigsten Teilprojekte vor:

? Abstrakte Syntaxentwicklung (Metamodellierung): Definition einer abstrakten Syntax für die Modellierung von Geschäfts-, System- und Softwaremodellen. Teilweise wird dies schon durch EMF bereitgestellt.
? Konkrete Syntaxentwicklung: Unterstützung für textuelle und grafische Syntaxstandards. Neben der grafischen Bearbeitung der UML könnte das Modell z.B. auch textuell definiert werden.
? Modelltransformation: Das zentrale Teilprojekt ist das Generative Model Transformer (GMT) Projekt, welches Transformationsdefinitionen und entsprechende Werkzeuge bietet.Model-to-Text Generierung: Typischerweise wird Programmcode aus Modellen generiert. Eclipse-Vertreter für diesen Bereich sind das Java Emitter Template (JET) und Teile des JMerge aus EMF.
? Industriestandards: Unterstützung einer Vielzahl weit verbreiteter Standards, wie z.B. UML, MDA, XSD oder SDO (Service Data Objects).
? Domänenspezifische Sprachen: Eclipse unterstützt die domänenspezifische Modellierung mit dem beschriebenen Projekt GMF. Ein entscheidender Bestandteil ist die automatisierte Produktion entsprechender Editoren für ein Fachmodell.

Ein interessanter Ansatz für die Integration dieser Teilschritte ist das Eclipse-Projekt Model Driven Development Integration. MDDi soll eine Plattform für verschiedenste Modellierungstools unterschiedlicher Hersteller bereitstellen. Die erweiterbare Umgebung soll den einheitlichen Austausch von Semantiken über diverse Modellstandards hinweg ermöglichen, die Interoperabilität zwischen den verschiedenen Werkzeugen verbessern und klare Prozessabläufe definieren. MDDi liefert für die Erreichung dieser Ziele konkrete technische Lösungen, wie einen ModelBus, der eine transparente Interaktion ermöglicht und das Semantic Binding, welches die Modellsemantik durch formale Metamodelle austauschbar machen soll.
Blick ins Buch
Inhaltsverzeichnis
Data Profiling mit Eclipse Von den Grundlagen zum Prototypen1
Inhaltsverzeichnis3
Begleitmaterial5
Abkürzungsverzeichnis6
1 Einleitung7
2 Datenqualität9
2.1 Definition9
2.2 Dimensionen der Datenqualität10
2.2.1 Fehlerfreiheit11
2.2.2 Vollständigkeit12
2.2.3 Zeitabhängige Dimensionen13
2.2.4 Konsistenzdimension14
2.2.5 Weitere Dimensionen15
2.3 Gründe und Folgen schlechter Datenqualität15
2.4 Ökonomische Betrachtung der Datenqualität17
2.5 Umfassendes Datenqualitätsmanagement18
2.6 ETL-Prozess20
2.7 Metadatenmanagement22
3 Data-Profiling24
3.1 Definition und Abgrenzung24
3.2 Vorgehensmodell25
3.3 Analysemethoden29
3.3.1 Syntaktische Analyse29
3.3.2 Strukturanalyse31
3.3.3 Semantische Analyse33
3.3.4 Statistische Analyse34
4 Werkzeugumgebung36
4.1 Eclipse Architektur36
4.2 Modellierung mit Eclipse39
4.2.1 Modellgetriebene Softwareentwicklung39
4.2.2 Eclipse Modeling Framework41
4.2.3 Graphical Modeling Framework44
4.2.4 Zukunft der Modellierung in Eclipse46
5 Konzept48
5.1 Ausgewählte Funktionalität existierender Werkzeuge48
5.1.1 DATRAS ADO-Profiler49
5.1.2 dfPower® Profile51
5.1.3 BDQ Analysis54
5.1.4 InfoZoom55
5.2 Anforderungsdefinition57
5.2.1 Funktionale Anforderungen58
5.2.2 Nicht-funktionale Anforderungen61
6 Systementwurf und -modellierung63
6.1 Modellgetriebene Entwicklung des Diagrammeditors63
6.1.1 Domänenmodell64
6.1.2 Grafische Definition66
6.1.3 Mapping-Definition68
6.1.4 Codegenerierung69
6.2 Komponentenmodell71
7 Implementierung74
7.1 Reverse Engineering74
7.2 Data Profiling Implementierung79
7.2.1 Analyse des Tabellenprofils79
7.2.2 Präsentation des Tabellenprofils in einer View82
7.2.3 Kontextsensitive Musteranalyse85
8 Zusammenfassung der Ergebnisse88
Literaturverzeichnis90
Anhang93

Weitere E-Books zum Thema: Projektmanagement - IT Projekte

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Krisen vermeiden in IT Projekten

E-Book Krisen vermeiden in IT Projekten
Mit Vorlagen auf CD-ROM Format: PDF

IT-Projekte haben in vielen Unternehmen eine zentrale Bedeutung. Sie binden Ressourcen und generieren entsprechende Kosten. Im Durchschnitt werden in Unternehmen 33 Projekte pro 1000 Mitarbeitern…

Krisen vermeiden in IT Projekten

E-Book Krisen vermeiden in IT Projekten
Mit Vorlagen auf CD-ROM Format: PDF

IT-Projekte haben in vielen Unternehmen eine zentrale Bedeutung. Sie binden Ressourcen und generieren entsprechende Kosten. Im Durchschnitt werden in Unternehmen 33 Projekte pro 1000 Mitarbeitern…

Krisen vermeiden in IT Projekten

E-Book Krisen vermeiden in IT Projekten
Mit Vorlagen auf CD-ROM Format: PDF

IT-Projekte haben in vielen Unternehmen eine zentrale Bedeutung. Sie binden Ressourcen und generieren entsprechende Kosten. Im Durchschnitt werden in Unternehmen 33 Projekte pro 1000 Mitarbeitern…

Krisen vermeiden in IT Projekten

E-Book Krisen vermeiden in IT Projekten
Mit Vorlagen auf CD-ROM Format: PDF

IT-Projekte haben in vielen Unternehmen eine zentrale Bedeutung. Sie binden Ressourcen und generieren entsprechende Kosten. Im Durchschnitt werden in Unternehmen 33 Projekte pro 1000 Mitarbeitern…

IT-Projektmanagement kompakt

E-Book IT-Projektmanagement kompakt
Format: PDF

IT-Projektmanagement kompakt beschreibt, welchen Herausforderungen sich IT-Projekte und deren Durchführende stellen müssen. Dem Leser wird unter anderem vermittelt, warum in Time and Budget…

Management- und Projekt-Methoden

E-Book Management- und Projekt-Methoden
Ein Leitfaden für IT, Organisation und Unternehmensentwicklung Format: PDF

Die Veränderungsprozesse in Wirtschaft und Verwaltung erfordern eine aktive Gestaltung des Wandels. Als Handwerkszeug dazu ist das Projektmanagement von großer Bedeutung. Dieses Buch unterstützt…

Management- und Projekt-Methoden

E-Book Management- und Projekt-Methoden
Ein Leitfaden für IT, Organisation und Unternehmensentwicklung Format: PDF

Die Veränderungsprozesse in Wirtschaft und Verwaltung erfordern eine aktive Gestaltung des Wandels. Als Handwerkszeug dazu ist das Projektmanagement von großer Bedeutung. Dieses Buch unterstützt…

Weitere Zeitschriften

Archiv und Wirtschaft

Archiv und Wirtschaft

"Archiv und Wirtschaft" ist die viermal jährlich erscheinende Verbandszeitschrift der Vereinigung der Wirtschaftsarchivarinnen und Wirtschaftsarchivare e. V. (VdW), in der seit 1967 rund 2.500 ...

Baumarkt

Baumarkt

Baumarkt enthält eine ausführliche jährliche Konjunkturanalyse des deutschen Baumarktes und stellt die wichtigsten Ergebnisse des abgelaufenen Baujahres in vielen Zahlen und Fakten zusammen. Auf ...

Burgen und Schlösser

Burgen und Schlösser

aktuelle Berichte zum Thema Burgen, Schlösser, Wehrbauten, Forschungsergebnisse zur Bau- und Kunstgeschichte, Denkmalpflege und Denkmalschutz Seit ihrer Gründung 1899 gibt die Deutsche ...

Correo

Correo

 La Revista de Bayer CropScience para la Agricultura ModernaPflanzenschutzmagazin für den Landwirt, landwirtschaftlichen Berater, Händler und am Thema Interessierten mit umfassender ...