Sie sind hier
E-Book

Data Mining

AutorJürgen Cleve, Uwe Lämmel
VerlagDe Gruyter Oldenbourg
Erscheinungsjahr2014
ReiheDe Gruyter Studium 
Seitenanzahl318 Seiten
ISBN9783486720341
FormatePUB/PDF
KopierschutzWasserzeichen
GerätePC/MAC/eReader/Tablet
Preis39,80 EUR
In den riesigen Datenbergen moderner Datenbanken steckt unentdecktes Wissen, das ohne geeignete Hilfsmittel kaum zu Tage gefördert werden kann. Hier setzt das Data Mining an und liefert Methoden und Algorithmen, um bisher unbekannte Zusammenhänge zu entdecken. Nach der Vermittlung der Grundlagen und Anwendungsklassen des Data Mining in den ersten beiden Kapiteln wird in Kapitel 3 auf geeignete Darstellungsmöglichkeiten für Data-Mining-Modelle eingegangen; Kapitel 4 behandelt die Algorithmen und Verfahrensklassen, Kapitel 5 geht auf konkrete Anwendungsarchitekturen ein. Das Buch deckt den Stoff einer einsemestrigen Vorlesung zu Data Mining an Universitäten oder Fachhochschulen ab und ist als klassisches Lehrbuch konzipiert. Es bietet Zusammenfassungen, zahlreiche Beispiele und Übungsaufgaben.

Prof. Dr. Jürgen Cleve, Hochschule Wismar

Prof. Dr. Uwe Lämmel, Hochschule Wismar

Kaufen Sie hier:

Horizontale Tabs

Blick ins Buch
Inhaltsverzeichnis
1 Einführung13
1.1 Auswertung von Massendaten13
1.2 Data Mining und Business Intelligence15
1.3 Ablauf einer Datenanalyse16
1.4 Interdisziplinarität23
1.5 Erfolgreiche Beispiele26
1.6 Werkzeuge28
1.6.1 KNIME29
1.6.2 WEKA38
1.6.3 JavaNNS43
2 Grundlagen des Data Mining49
2.1 Grundbegriffe49
2.2 Datentypen51
2.3 Abstands- und Ähnlichkeitsmaße55
2.4 Grundlagen Künstlicher Neuronaler Netze59
2.5 Logik64
2.6 Überwachtes und unüberwachtes Lernen67
3 Anwendungsklassen69
3.1 Cluster-Analyse69
3.2 Klassifikation71
3.3 Numerische Vorhersage73
3.4 Assoziationsanalyse75
3.5 Text Mining77
3.6 Web Mining78
4 Wissensrepräsentation81
4.1 Entscheidungstabelle81
4.2 Entscheidungsbäume83
4.3 Regeln84
4.4 Assoziationsregeln85
4.5 Instanzenbasierte Darstellung91
4.6 Repräsentation von Clustern91
4.7 Neuronale Netze als Wissensspeicher92
5 Klassifikation95
5.1 K-Nearest Neighbour95
5.1.1 K-Nearest-Neighbour-Algorithmus97
5.1.2 Ein verfeinerter Algorithmus101
5.2 Entscheidungsbaumlernen104
5.2.1 Erzeugen eines Entscheidungsbaums104
5.2.2 Auswahl eines Attributs106
5.2.3 Der ID3-Algorithmus zur Erzeugung eines Entscheidungsbaums108
5.2.4 Entropie116
5.2.5 Der Gini-Index118
5.2.6 Der C4.5-Algorithmus118
5.2.7 Probleme beim Entscheidungsbaumlernen120
5.2.8 Entscheidungsbaum und Regeln121
5.3 Naive Bayes123
5.3.1 Bayessche Formel123
5.3.2 Der Naive-Bayes-Algorithmus124
5.4 Vorwärtsgerichtete Neuronale Netze129
5.4.1 Architektur129
5.4.2 Das Backpropagation-of-Error-Lernverfahren131
5.4.3 Modifikationen des Backpropagation-Algorithmus135
5.4.4 Ein Beispiel137
5.5 Support Vector Machines140
5.5.1 Grundprinzip140
5.5.2 Formale Darstellung von Support Vector Machines142
5.5.3 Ein Beispiel144
6 Cluster-Analyse147
6.1 Arten der Cluster-Analyse147
6.2 Der k-Means-Algorithmus151
6.3 Der k-Medoid-Algorithmus160
6.4 Erwartungsmaximierung165
6.5 Agglomeratives Clustern167
6.6 Dichtebasiertes Clustern172
6.7 Clusterbildung mittels selbstorganisierender Karten175
6.7.1 Aufbau175
6.7.2 Lernen176
6.7.3 Visualisierung einer SOM179
6.7.4 Ein Beispiel180
6.8 Clusterbildung mittels neuronaler Gase182
6.9 Clusterbildung mittels ART184
7 Assoziationsanalyse187
7.1 Der A-Priori-Algorithmus187
7.1.1 Generierung der Kandidaten189
7.1.2 Erzeugen der Regeln191
7.2 Frequent Pattern Growth197
7.3 Assoziationsregeln für spezielle Aufgaben201
7.3.1 Hierarchische Assoziationsregeln201
7.3.2 Quantitative Assoziationsregeln202
7.3.3 Erzeugung von temporalen Assoziationsregeln204
8 Datenvorbereitung207
8.1 Motivation207
8.2 Arten der Datenvorbereitung209
8.2.1 Datenselektion und -integration210
8.2.2 Datensäuberung211
8.2.3 Datenreduktion218
8.2.4 Datentransformation221
8.3 Ein Beispiel227
9 Bewertung233
9.1 Prinzip der minimalen Beschreibungslängen234
9.2 Interessantheitsmaße für Assoziationsregeln234
9.2.1 Support235
9.2.2 Konfidenz235
9.2.3 Gain-Funktion237
9.2.4 p-s-Funktion238
9.2.5 Lift239
9.3 Gütemaße und Fehlerkosten239
9.3.1 Fehlerraten239
9.3.2 Weitere Gütemaße für Klassifikatoren240
9.3.3 Fehlerkosten242
9.4 Testmengen243
9.5 Qualität von Clustern245
9.6 Visualisierung247
10 Eine Data-Mining-Aufgabe257
10.1 Die Aufgabe257
10.2 Das Problem258
10.3 Die Daten260
10.4 Datenvorbereitung265
10.5 Experimente268
10.5.1 K-Nearest Neighbour270
10.5.2 Naive Bayes272
10.5.3 Entscheidungsbaumverfahren274
10.5.4 Neuronale Netze277
10.6 Auswertung der Ergebnisse284
A Anhang287
A.1 Iris-Daten287
A.2 Sojabohnen289
A.3 Wetter-Daten291
A.4 Kontaktlinsen-Daten293
Abbildungsverzeichnis295
Tabellenverzeichnis303
Verzeichnis der Symbole305
Verzeichnis der Abkürzungen307
Literaturverzeichnis309
Index315

Weitere E-Books zum Thema: Informatik - Algorithmen - Softwaresysteme

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Weitere Zeitschriften

Atalanta

Atalanta

Atalanta ist die Zeitschrift der Deutschen Forschungszentrale für Schmetterlingswanderung. Im Atalanta-Magazin werden Themen behandelt wie Wanderfalterforschung, Systematik, Taxonomie und Ökologie. ...

Burgen und Schlösser

Burgen und Schlösser

aktuelle Berichte zum Thema Burgen, Schlösser, Wehrbauten, Forschungsergebnisse zur Bau- und Kunstgeschichte, Denkmalpflege und Denkmalschutz Seit ihrer Gründung 1899 gibt die Deutsche ...

Card-Forum

Card-Forum

Card-Forum ist das marktführende Magazin im Themenbereich der kartengestützten Systeme für Zahlung und Identifikation, Telekommunikation und Kundenbindung sowie der damit verwandten und ...

DER PRAKTIKER

DER PRAKTIKER

Technische Fachzeitschrift aus der Praxis für die Praxis in allen Bereichen des Handwerks und der Industrie. “der praktiker“ ist die Fachzeitschrift für alle Bereiche der fügetechnischen ...

Deutsche Tennis Zeitung

Deutsche Tennis Zeitung

Die DTZ – Deutsche Tennis Zeitung bietet Informationen aus allen Bereichen der deutschen Tennisszene –sie präsentiert sportliche Highlights, analysiert Entwicklungen und erläutert ...

DSD Der Sicherheitsdienst

DSD Der Sicherheitsdienst

Der "DSD – Der Sicherheitsdienst" ist das Magazin der Sicherheitswirtschaft. Es erscheint viermal jährlich und mit einer Auflage von 11.000 Exemplaren. Der DSD informiert über aktuelle Themen ...