Sie sind hier
E-Book

Data Mining

AutorJürgen Cleve, Uwe Lämmel
VerlagDe Gruyter Oldenbourg
Erscheinungsjahr2014
ReiheDe Gruyter Studium 
Seitenanzahl318 Seiten
ISBN9783486720341
FormatePUB/PDF
KopierschutzWasserzeichen
GerätePC/MAC/eReader/Tablet
Preis39,80 EUR
In den riesigen Datenbergen moderner Datenbanken steckt unentdecktes Wissen, das ohne geeignete Hilfsmittel kaum zu Tage gefördert werden kann. Hier setzt das Data Mining an und liefert Methoden und Algorithmen, um bisher unbekannte Zusammenhänge zu entdecken. Nach der Vermittlung der Grundlagen und Anwendungsklassen des Data Mining in den ersten beiden Kapiteln wird in Kapitel 3 auf geeignete Darstellungsmöglichkeiten für Data-Mining-Modelle eingegangen; Kapitel 4 behandelt die Algorithmen und Verfahrensklassen, Kapitel 5 geht auf konkrete Anwendungsarchitekturen ein. Das Buch deckt den Stoff einer einsemestrigen Vorlesung zu Data Mining an Universitäten oder Fachhochschulen ab und ist als klassisches Lehrbuch konzipiert. Es bietet Zusammenfassungen, zahlreiche Beispiele und Übungsaufgaben.

Prof. Dr. Jürgen Cleve, Hochschule Wismar

Prof. Dr. Uwe Lämmel, Hochschule Wismar

Kaufen Sie hier:

Horizontale Tabs

Blick ins Buch
Inhaltsverzeichnis
1 Einführung13
1.1 Auswertung von Massendaten13
1.2 Data Mining und Business Intelligence15
1.3 Ablauf einer Datenanalyse16
1.4 Interdisziplinarität23
1.5 Erfolgreiche Beispiele26
1.6 Werkzeuge28
1.6.1 KNIME29
1.6.2 WEKA38
1.6.3 JavaNNS43
2 Grundlagen des Data Mining49
2.1 Grundbegriffe49
2.2 Datentypen51
2.3 Abstands- und Ähnlichkeitsmaße55
2.4 Grundlagen Künstlicher Neuronaler Netze59
2.5 Logik64
2.6 Überwachtes und unüberwachtes Lernen67
3 Anwendungsklassen69
3.1 Cluster-Analyse69
3.2 Klassifikation71
3.3 Numerische Vorhersage73
3.4 Assoziationsanalyse75
3.5 Text Mining77
3.6 Web Mining78
4 Wissensrepräsentation81
4.1 Entscheidungstabelle81
4.2 Entscheidungsbäume83
4.3 Regeln84
4.4 Assoziationsregeln85
4.5 Instanzenbasierte Darstellung91
4.6 Repräsentation von Clustern91
4.7 Neuronale Netze als Wissensspeicher92
5 Klassifikation95
5.1 K-Nearest Neighbour95
5.1.1 K-Nearest-Neighbour-Algorithmus97
5.1.2 Ein verfeinerter Algorithmus101
5.2 Entscheidungsbaumlernen104
5.2.1 Erzeugen eines Entscheidungsbaums104
5.2.2 Auswahl eines Attributs106
5.2.3 Der ID3-Algorithmus zur Erzeugung eines Entscheidungsbaums108
5.2.4 Entropie116
5.2.5 Der Gini-Index118
5.2.6 Der C4.5-Algorithmus118
5.2.7 Probleme beim Entscheidungsbaumlernen120
5.2.8 Entscheidungsbaum und Regeln121
5.3 Naive Bayes123
5.3.1 Bayessche Formel123
5.3.2 Der Naive-Bayes-Algorithmus124
5.4 Vorwärtsgerichtete Neuronale Netze129
5.4.1 Architektur129
5.4.2 Das Backpropagation-of-Error-Lernverfahren131
5.4.3 Modifikationen des Backpropagation-Algorithmus135
5.4.4 Ein Beispiel137
5.5 Support Vector Machines140
5.5.1 Grundprinzip140
5.5.2 Formale Darstellung von Support Vector Machines142
5.5.3 Ein Beispiel144
6 Cluster-Analyse147
6.1 Arten der Cluster-Analyse147
6.2 Der k-Means-Algorithmus151
6.3 Der k-Medoid-Algorithmus160
6.4 Erwartungsmaximierung165
6.5 Agglomeratives Clustern167
6.6 Dichtebasiertes Clustern172
6.7 Clusterbildung mittels selbstorganisierender Karten175
6.7.1 Aufbau175
6.7.2 Lernen176
6.7.3 Visualisierung einer SOM179
6.7.4 Ein Beispiel180
6.8 Clusterbildung mittels neuronaler Gase182
6.9 Clusterbildung mittels ART184
7 Assoziationsanalyse187
7.1 Der A-Priori-Algorithmus187
7.1.1 Generierung der Kandidaten189
7.1.2 Erzeugen der Regeln191
7.2 Frequent Pattern Growth197
7.3 Assoziationsregeln für spezielle Aufgaben201
7.3.1 Hierarchische Assoziationsregeln201
7.3.2 Quantitative Assoziationsregeln202
7.3.3 Erzeugung von temporalen Assoziationsregeln204
8 Datenvorbereitung207
8.1 Motivation207
8.2 Arten der Datenvorbereitung209
8.2.1 Datenselektion und -integration210
8.2.2 Datensäuberung211
8.2.3 Datenreduktion218
8.2.4 Datentransformation221
8.3 Ein Beispiel227
9 Bewertung233
9.1 Prinzip der minimalen Beschreibungslängen234
9.2 Interessantheitsmaße für Assoziationsregeln234
9.2.1 Support235
9.2.2 Konfidenz235
9.2.3 Gain-Funktion237
9.2.4 p-s-Funktion238
9.2.5 Lift239
9.3 Gütemaße und Fehlerkosten239
9.3.1 Fehlerraten239
9.3.2 Weitere Gütemaße für Klassifikatoren240
9.3.3 Fehlerkosten242
9.4 Testmengen243
9.5 Qualität von Clustern245
9.6 Visualisierung247
10 Eine Data-Mining-Aufgabe257
10.1 Die Aufgabe257
10.2 Das Problem258
10.3 Die Daten260
10.4 Datenvorbereitung265
10.5 Experimente268
10.5.1 K-Nearest Neighbour270
10.5.2 Naive Bayes272
10.5.3 Entscheidungsbaumverfahren274
10.5.4 Neuronale Netze277
10.6 Auswertung der Ergebnisse284
A Anhang287
A.1 Iris-Daten287
A.2 Sojabohnen289
A.3 Wetter-Daten291
A.4 Kontaktlinsen-Daten293
Abbildungsverzeichnis295
Tabellenverzeichnis303
Verzeichnis der Symbole305
Verzeichnis der Abkürzungen307
Literaturverzeichnis309
Index315

Weitere E-Books zum Thema: Informatik - Algorithmen - Softwaresysteme

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Softwaretechnik

E-Book Softwaretechnik
Format: PDF

Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Software Engineering

E-Book Software Engineering
Architektur-Design und Prozessorientierung Format: PDF

Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…

Weitere Zeitschriften

arznei-telegramm

arznei-telegramm

Das arznei-telegramm® informiert bereits im 53. Jahrgang Ärzte, Apotheker und andere Heilberufe über Nutzen und Risiken von Arzneimitteln. Das arznei-telegramm®  ist neutral und ...

Ärzte Zeitung

Ärzte Zeitung

Zielgruppe:  Niedergelassene Allgemeinmediziner, Praktiker und Internisten. Charakteristik:  Die Ärzte Zeitung liefert 3 x pro Woche bundesweit an niedergelassene Mediziner ...

Berufsstart Bewerbung

Berufsstart Bewerbung

»Berufsstart Bewerbung« erscheint jährlich zum Wintersemester im November mit einer Auflage von 50.000 Exemplaren und ermöglicht Unternehmen sich bei Studenten und Absolventen mit einer ...

Burgen und Schlösser

Burgen und Schlösser

aktuelle Berichte zum Thema Burgen, Schlösser, Wehrbauten, Forschungsergebnisse zur Bau- und Kunstgeschichte, Denkmalpflege und Denkmalschutz Seit ihrer Gründung 1899 gibt die Deutsche ...

crescendo

crescendo

Die Zeitschrift für Blas- und Spielleutemusik in NRW - Informationen aus dem Volksmusikerbund NRW - Berichte aus 23 Kreisverbänden mit über 1000 Blasorchestern, Spielmanns- und Fanfarenzügen - ...

Demeter-Gartenrundbrief

Demeter-Gartenrundbrief

Einzige Gartenzeitung mit Anleitungen und Erfahrungsberichten zum biologisch-dynamischen Anbau im Hausgarten (Demeter-Anbau). Mit regelmäßigem Arbeitskalender, Aussaat-/Pflanzzeiten, Neuigkeiten ...

ea evangelische aspekte

ea evangelische aspekte

evangelische Beiträge zum Leben in Kirche und Gesellschaft Die Evangelische Akademikerschaft in Deutschland ist Herausgeberin der Zeitschrift evangelische aspekte Sie erscheint viermal im Jahr. In ...