Sie sind hier
E-Book

Moderne Datenanalyse mit R

Daten einlesen, aufbereiten, visualisieren, modellieren und kommunizieren

AutorSebastian Sauer
VerlagSpringer Gabler
Erscheinungsjahr2019
Seitenanzahl559 Seiten
ISBN9783658215873
FormatPDF
KopierschutzWasserzeichen/DRM
GerätePC/MAC/eReader/Tablet
Preis34,99 EUR
Die Kaufempfehlung, die Ihnen ein Webstore ausspricht, die Einschätzung, welcher Kunde kreditwürdig ist, oder die Analyse der Werttreiber von Immobilien - alle diese Beispiele aus dem heutigen Leben sind Ergebnis moderner Verfahren der Datenanalyse. Dieses Buch führt in solche statistische Verfahren anhand der Programmiersprache R ein. 

Ziel ist es, Leser mit der Art und Weise vertraut zu machen, wie führende Organisationen und Praktiker angewandte Statistik heute einsetzen. Weil sich mit der Digitalisierung auch die statistischen Verfahren verändert haben, vermittelt der Autor neben klassischen Analysemethoden wie Regression auch moderne Methoden wie Textmining und Random-Forest-Modelle. Dabei sind die Inhalte des Buchs durchgehend so aufbereitet, dass sie auch für Leser ohne umfangreiche mathematische Vorkenntnisse verständlich sind. Anhand von Fallbeispielen und Übungen werden die Leser durch alle Phasen der Datenanalyse geführt: Sie lernen, wie Daten eingelesen, aufbereitet, visualisiert, modelliert und kommuniziert werden können. Dabei wird vor allem die Aufbereitung, Umformung und Prüfung der Daten ausführlicher als in anderen Publikationen behandelt, da dieser Teil in der Praxis oft einen wesentlichen Teil des Aufwands ausmacht. Aber auch die Visualisierung bekommt viel Raum, denn gute Diagramme ermöglichen Einblicke, die Zahlen und Worte verbergen.
Mit seinem praxisorientierten Ansatz will das Buch dazu befähigen,
  • alle grundlegenden Schritte eines Datenanalyseprojekts durchzuführen,
  • Daten kompetent in R zu bearbeiten,
  • simulationsbasierte Inferenzstatistik anzuwenden und kritisch zu hinterfragen,
  • klassische und moderne Vorhersagemethoden anzuwenden und
  • betriebswirtschaftliche Fragestellungen mittels datengetriebener Vorhersagemodelle zu beantworten.
Sowohl Anwender ohne statistisches Grundlagenwissen als auch Nutzer mit Vorerfahrung lesen dieses Buch mit Gewinn. In verständlicher Sprache und anhand von anschaulichen Beispielen zeigt der Autor, wie moderne Datenanalyse heute funktioniert. 


Professor Dr. habil. Sebastian Sauer arbeitet als Hochschullehrer für Wirtschaftspsychologie an der FOM Hochschule für Oekonomie & Management in Nürnberg und versteht sich als Data Scientist. Daten mit R zu analysieren, ist aktuell eines seiner zentralen Interessensgebiete. Besonderes Augenmerk legt er auf den Erkenntnisbeitrag, den neue Analyseverfahren leisten. Neben dem 'Wie' der Datenanalyse beschäftigen ihn die Grenzen und Gefahren, die die moderne Datenwissenschaft für den Einzelnen und die Zivilgesellschaft mit sich bringt. Außerdem engagiert er sich für das Thema Open Science und interessiert sich für die Frage, wie die Psychologie zur Klärung von Problemen mit gesellschaftlicher Relevanz beitragen kann. Sein Blog https://data-se.netlify.com/ dient ihm als Notizbuch sich entwickelnder Gedanken. Data Science für die Wirtschaft bietet er auf https://www.data-divers.com/ an.

Kaufen Sie hier:

Horizontale Tabs

Blick ins Buch
Inhaltsverzeichnis
Vorwort6
Inhaltsverzeichnis12
Der Autor12
Teil I Rahmen23
1 Statistik heute24
1.1 Datenanalyse, Statistik, Data Science und Co.25
1.2 Wissensgebiete der Datenanalyse27
1.3 Einige Grundbegriffe29
1.4 Signal und Rauschen30
2 Hallo, R33
2.1 Eine kurze Geschichte von R33
2.2 Warum R? Warum, R?35
3 R starten40
3.1 R und RStudio installieren40
3.2 Pakete42
3.3 Hilfe! R startet nicht!44
3.4 Zuordnung von Paketen zu Befehlen46
3.5 R-Skript-Dateien48
3.6 Daten48
3.7 Grundlagen der Arbeit mit RStudio49
3.8 Hier werden Sie geholfen52
4 Erstkontakt55
4.1 R ist pingelig55
4.2 Variablen zuweisen und auslesen56
4.3 Funktionen aufrufen57
4.4 Logische Prüfungen58
4.5 Vektorielle Funktionen60
4.6 Literaturempfehlungen61
Teil II Daten einlesen62
5 Datenstrukturen63
5.1 Überblick über die wichtigsten Objekttypen63
5.2 Objekttypen in R65
5.3 Daten auslesen und indizieren71
5.4 Namen geben76
6 Datenimport und -export79
6.1 Daten in R importieren79
6.2 Textkodierung84
6.3 Daten exportieren85
Teil III Daten aufbereiten88
7 Datenjudo89
7.1 Daten aufbereiten mit dplyr91
7.2 Zentrale Bausteine von dplyr92
7.3 Die Pfeife105
7.4 Spalten berechnen mit mutate()107
7.5 Bedingte Analysen mit den Suffixen von dplyr110
7.6 Tabellen zusammenführen (join)113
8 Deskriptive Statistik116
8.1 Univariate Statistik117
8.2 Korrelationen berechnen125
9 Praxisprobleme der Datenaufbereitung130
9.1 Fehlende Werte131
9.2 Datenanomalien138
9.3 Daten umformen143
9.4 Werte umkodieren und partitionieren149
9.5 Vektoren zu Skalaren zusammenfassen154
10 Fallstudie: Datenjudo157
10.1 Deskriptive Statistiken zu den New Yorker Flügen158
10.2 Visualisierungen zu den deskriptiven Statistiken161
Teil IV Daten visualisieren166
11 Datenvisualisierung mit ggplot2167
11.1 Einstieg in ggplot2168
11.2 Häufige Arten von Diagrammen (Geomen)176
11.3 Die Gefühlswelt von ggplot2188
11.4 ggplot(), der große Bruder von qplot()189
12 Fortgeschrittene Themen der Visualisierung197
12.1 Farbwahl197
12.2 ggplot2-Themen204
12.3 Interaktive Diagramme207
13 Fallstudie: Visualisierung210
13.1 Umfragedaten visualisieren mit „likert“211
13.2 Umfragedaten visualisieren mit ggplot212
14 Geovisualisierung224
14.1 Kartendaten225
14.2 Unterschiede in Kartensegmenten visualisieren228
14.3 Weltkarten233
14.4 Anwendungsbeispiel: Konkordanz von Kulturwerten und Wohlbefinden238
14.5 Interaktive Karten243
Teil V Modellieren251
15 Grundlagen des Modellierens252
15.1 Was ist ein Modell? Was ist Modellieren?253
15.2 Abduktion als Erkenntnisfigur im Modellieren255
15.3 Ein Beispiel zum Modellieren in der Datenanalyse257
15.4 Taxonomie der Ziele des Modellierens258
15.5 Die vier Schritte des statistischen Modellierens261
15.6 Einfache vs. komplexe Modelle: Unter- vs. Überanpassung262
15.7 Bias-Varianz-Abwägung263
15.8 Trainings- vs. Test-Stichprobe264
15.9 Resampling und Kreuzvalidierung266
15.10 Wann welches Modell?267
15.11 Modellgüte267
15.12 Der Fluch der Dimension269
16 Inferenzstatistik274
16.1 Wozu Inferenzstatistik?275
16.2 Der p-Wert276
16.3 Wann welcher Inferenztest?284
16.4 Beispiele für häufige Inferenztests285
16.5 Alternativen zum p-Wert293
17 Simulationsbasierte Inferenz308
17.1 Stichproben, Statistiken und Population308
17.2 Die Stichprobenverteilung311
17.3 Der Bootstrap315
17.4 Nullhypothesen auf Signifikanz testen318
Teil VI Geleitetes Modellieren325
18 Lineare Modelle326
18.1 Die Idee der klassischen Regression326
18.2 Modellgüte329
18.3 Die Regression an einem Beispiel erläutert332
18.4 Überprüfung der Annahmen der linearen Regression334
18.5 Regression mit kategorialen Prädiktoren336
18.6 Multiple Regression338
18.7 Interaktionen340
18.8 Prädiktorenrelevanz342
18.9 Anwendungsbeispiel zur linearen Regression344
19 Klassifizierende Regression350
19.1 Normale Regression für ein binäres Kriterium351
19.2 Die logistische Funktion352
19.3 Interpretation des Logits355
19.4 Kategoriale Prädiktoren356
19.5 Multiple logistische Regression357
19.6 Modellgüte358
19.7 Vorhersagen361
19.8 ROC-Kurven und Fläche unter der Kurve (AUC)362
20 Fallstudie: Titanic369
20.1 Explorative Analyse370
20.2 Inferenzstatistik372
21 Baumbasierte Verfahren381
21.1 Entscheidungsbäume382
21.2 Entscheidungsbäume mit caret388
21.3 Der Algorithmus der Entscheidungsbäume395
21.4 Regressionsbäume395
21.5 Stärken und Schwächen von Bäumen395
21.6 Bagging397
21.7 Grundlagen von Random Forests398
21.8 Variablenrelevanz bei Baummodellen402
22 Fallstudie: Kreditwürdigkeit mit caret405
22.1 Zwei Arten der prädiktiven Modellierung406
22.2 Daten aufbereiten407
22.3 Modelle anpassen411
22.4 Modellgüte bestimmen422
22.5 Wichtigkeit der Prädiktoren bestimmen430
Teil VII Ungeleitetes Modellieren438
23 Clusteranalyse439
23.1 Grundlagen der Clusteranalyse439
23.2 Beispiel für eine einfache Clusteranalyse445
24 Textmining451
24.1 Grundlegende Analyse452
24.2 Sentimentanalyse461
25 Fallstudie: Twitter-Mining465
25.1 Zum Einstieg: Moderne Methoden der Sentimentanalyse466
25.2 Grundlagen des Twitter-Minings467
Teil VIII Kommunizieren475
26 RMarkdown476
26.1 Forderungen an Werkzeuge zur Berichterstellung477
26.2 Start mit RMarkdown479
26.3 RMarkdown in Action481
26.4 Aufbau einer Markdown-Datei483
26.5 Syntax-Grundlagen von Markdown484
26.6 Tabellen485
26.7 Zitieren488
26.8 Format-Vorlagen für RMarkdown490
Teil IX Rahmen 2493
27 Projektmanagement am Beispiel einer Fallstudie494
27.1 Was ist Populismus?495
27.2 Forschungsfrage und Operationalisierung496
27.3 Emotionslexikon497
27.4 Daten, Stichprobe und Analysekontext498
27.5 Prozess der Datenanalyse498
27.6 Zentrale Ergebnisse500
27.7 Projektmanagement503
28 Programmieren mit R510
28.1 Funktionen schreiben510
28.2 Wiederholungen513
28.3 Defensives Programmieren522
29 Programmieren mit dplyr525
29.1 Wie man mit dplyr nicht sprechen darf525
29.2 Standard-Evaluation vs. Non-Standard-Evaluation526
29.3 NSE als Backen528
29.4 Wie man Funktionen mit dplyr-Verben schreibt532
29.5 Beispiele für NSE-Funktionen535
Anhang A539
Literatur545
Sachverzeichnis556

Weitere E-Books zum Thema: Nachschlagewerke Wirtschaft - Wirtschaftswissenschaften

Informationsmanagement

E-Book Informationsmanagement
Format: PDF

Informationsmanagement hat die Aufgabe, den für das Unternehmensziel bestmöglichen Einsatz der Ressource Information zu gewährleisten. Das Buch zeigt, dass Informations- und Kommunikationstechniken…

Informationsmanagement

E-Book Informationsmanagement
Format: PDF

Informationsmanagement hat die Aufgabe, den für das Unternehmensziel bestmöglichen Einsatz der Ressource Information zu gewährleisten. Das Buch zeigt, dass Informations- und Kommunikationstechniken…

Geschäftsprozesse

E-Book Geschäftsprozesse
Modell- und computergestützte Planung Format: PDF

Das Buch zeigt konkret und systematische wie Prozesse konzipiert, erfasst, geändert oder optimiert werden können. Einfache Beispiele und Übungen veranschaulichen die Ausführungen zum Thema. NEU…

Geschäftsprozesse

E-Book Geschäftsprozesse
Modell- und computergestützte Planung Format: PDF

Das Buch zeigt konkret und systematische wie Prozesse konzipiert, erfasst, geändert oder optimiert werden können. Einfache Beispiele und Übungen veranschaulichen die Ausführungen zum Thema. NEU…

Geschäftsprozesse

E-Book Geschäftsprozesse
Modell- und computergestützte Planung Format: PDF

Das Buch zeigt konkret und systematische wie Prozesse konzipiert, erfasst, geändert oder optimiert werden können. Einfache Beispiele und Übungen veranschaulichen die Ausführungen zum Thema. NEU…

Geschäftsprozesse

E-Book Geschäftsprozesse
Modell- und computergestützte Planung Format: PDF

Das Buch zeigt konkret und systematische wie Prozesse konzipiert, erfasst, geändert oder optimiert werden können. Einfache Beispiele und Übungen veranschaulichen die Ausführungen zum Thema. NEU…

Weitere Zeitschriften

Archiv und Wirtschaft

Archiv und Wirtschaft

"Archiv und Wirtschaft" ist die viermal jährlich erscheinende Verbandszeitschrift der Vereinigung der Wirtschaftsarchivarinnen und Wirtschaftsarchivare e. V. (VdW), in der seit 1967 rund 2.500 ...

arznei-telegramm

arznei-telegramm

Das arznei-telegramm® informiert bereits im 53. Jahrgang Ärzte, Apotheker und andere Heilberufe über Nutzen und Risiken von Arzneimitteln. Das arznei-telegramm®  ist neutral und ...

Ärzte Zeitung

Ärzte Zeitung

Zielgruppe:  Niedergelassene Allgemeinmediziner, Praktiker und Internisten. Charakteristik:  Die Ärzte Zeitung liefert 3 x pro Woche bundesweit an niedergelassene Mediziner ...

Augenblick mal

Augenblick mal

Die Zeitschrift mit den guten Nachrichten "Augenblick mal" ist eine Zeitschrift, die in aktuellen Berichten, Interviews und Reportagen die biblische Botschaft und den christlichen Glauben ...

BEHINDERTEPÄDAGOGIK

BEHINDERTEPÄDAGOGIK

Für diese Fachzeitschrift arbeiten namhafte Persönlichkeiten aus den verschiedenen Fotschungs-, Lehr- und Praxisbereichen zusammen. Zu ihren Aufgaben gehören Prävention, Früherkennung, ...

Berufsstart Gehalt

Berufsstart Gehalt

»Berufsstart Gehalt« erscheint jährlich zum Sommersemester im Mai mit einer Auflage von 50.000 Exemplaren und ermöglicht Unternehmen sich bei Studenten und Absolventen mit einer ...

BONSAI ART

BONSAI ART

Auflagenstärkste deutschsprachige Bonsai-Zeitschrift, basierend auf den renommiertesten Bonsai-Zeitschriften Japans mit vielen Beiträgen europäischer Gestalter. Wertvolle Informationen für ...

care konkret

care konkret

care konkret ist die Wochenzeitung für Entscheider in der Pflege. Ambulant wie stationär. Sie fasst topaktuelle Informationen und Hintergründe aus der Pflegebranche kompakt und kompetent für Sie ...

DHS

DHS

Die Flugzeuge der NVA Neben unser F-40 Reihe, soll mit der DHS die Geschichte der "anderen" deutschen Luftwaffe, den Luftstreitkräften der Nationalen Volksarmee (NVA-LSK) der ehemaligen DDR ...

Euphorion

Euphorion

EUPHORION wurde 1894 gegründet und widmet sich als „Zeitschrift für Literaturgeschichte“ dem gesamten Fachgebiet der deutschen Philologie. Mindestens ein Heft pro Jahrgang ist für die ...