1
Die stille Revolution: Algorithmen, Daten und Netze
Wir sind uns oft gar nicht bewusst, wie rasch digitale Innovationen die Welt verändern. Google zum Beispiel hat als ein von der amerikanischen Forschungsbehörde subventioniertes Projekt begonnen und nur kurze Zeit später unsere Medien- und Wissenswelt mit seiner mächtigen Suchmaschine (und anderen Angeboten) komplett verändert. Das gilt auch, um ein zweites Beispiel zu nennen, für Stats Monkey, ein von Studenten in den USA entwickeltes Schreib-Programm, das nun selbstständig zum Beispiel einfache Sportberichte erstellt. Die aus Agenturmeldungen halbautomatisch generierten Inhalte für Medien sollen es ermöglichen, durch Preissenkungen Leserinnen und Leser zurückzugewinnen, welche Zeitungen im Zuge der Digitalisierung an das Internet verloren haben. Kurz: Algorithmen erlauben es, Kulturtechniken zu automatisieren. Damit verliert der Mensch eine bis dahin ihm vorbehaltene Domäne an die Maschine.
Für die Historiographie stellt sich die Frage, ob die neuen digitalen Medien »geschichtsmächtig« sind. Sie verwandeln Raum und Zeit in fließende Kategorien, deren Grenzen zu verschwimmen scheinen. Digitale Medien besitzen eine Tiefendimension, die wir noch gar nicht vollständig ausgelotet haben. Arbeiten vernetzen sich, werden im Internet öffentlich zugänglich, der Zugang zu den Quellen beschleunigt sich und die Vermittlung von Forschungsresultaten erfolgt immer häufiger im Internet. Es findet eine Öffnung statt, welche die Grenzen zwischen den Produzenten und den Konsumenten von historischem Wissen verwischt. Immer mehr Nutzerinnen und Nutzer sind bereit, in Wertschöpfungsketten Arbeiten zu übernehmen, die zuvor Produzenten erledigt haben. Diese Verlagerung führt zu einer massiven Erweiterung des Kreises von Personen, die sich beteiligen. Kurz: Das Potenzial des digitalen Wandels für geisteswissenschaftliche Innovationen ist ohne Zweifel groß.
Für die Geschichtswissenschaft ist essentiell, dass sie der Offenheit des Web Standards für die Qualität von Inhalten gegenüber stellt. Das Netz verändert die Beziehungen zwischen Individuum, Kollektiv und Wissen: Dem Verlust von individueller Autorität in Bezug auf Wissen steht der Gewinn von Bedeutung in der kollektiven historischen Sinnbildung gegenüber. Um das organisatorisch zu bewältigen, braucht es neue Forschungsinfrastrukturen. Die Summe all dieser Faktoren ergibt dann eine neue »digitale Geschichtswissenschaft«, sagt Wolfgang Schmale.18 Auch das Massachusetts Institute of Technology (MIT) schätzt das geisteswissenschaftliche Potenzial des digitalen Wandels als hoch ein:
»The Digital Humanities will revitalize the liberal arts tradition in the electronically inflected, design-driven, multimedia language of the twenty-first century«,
fassen die Autoren und Autorinnen diesen Wandel einleitend zusammen.19 Es geht dabei nicht allein um den Aufbau von digitalen Speichern und das Schaffen von Konventionen für den Zugang, die Nutzung und Publikation digitaler Verzeichnisse, Quellen und Textprodukte, sondern um viel mehr: Der Wechsel von analogen zu digitalen Medien und moderne Web-Technologien ziehen zahlreiche Möglichkeiten wie auch Zwänge nach sich. Dies erfordert ein experimentelles Denken und ein Wirken über die digitale beziehungsweise analoge Spaltung hinweg.
Die Geschichtswissenschaft benötigt Innovationen, einen Weg, um Wissen mit neuen Kompetenz-Sets wie Data-Mining, Inhaltsmodellierung und Design zu produzieren. Benötigt werden eigene Programmiersprachen und neue, nicht ausschließlich quantitative Techniken, wie wir sie heute schon kennen: Interpretatives Mapping, Visualisierung und andere Methoden könnten dann unseren Analysen historischer Welten Formen verleihen, die kulturell und medial unseren hybriden Lebenswelten besser entsprechen. Mehr davon im Kapitel »Hybridität« im Perspektiventeil dieses Buches (vgl. S. 84).
Eine eindrückliche Sammlung von Beispielen darüber, was insbesondere die Visualisierung für die Vermittlung von Wissen bewirken kann, ist der Atlas of Science. Der Herausgeber, das MIT, hat den Atlas in Anlehnung an Modelle der Kartographie gestaltet. Er schreibt dazu in der Einleitung:
»Cartographic maps have guided our explorations for centuries, allowing us to navigate the world. Science maps have the potential to guide our search for knowledge in the same way, helping us navigate, understand and communicate the dynamic and changing structure of science and technology. Allowing us to visualize scientific results, science maps help us make sense of the avalanche of data generated by scientific research today.«20
Für historisch Arbeitende ist wichtig zu erkennen, dass Tools nicht einfach nur Werkzeuge, sondern kognitive Schnittstellen sind, die Wissen produzieren und vermitteln und deshalb organisiert werden müssen.21 Das Vertrauen in Computer für die Auswahl, das Aggregieren und für die Synthese von Daten wächst. Wir befassen uns schon jetzt mit Texten, Zusammenfassungen und Analysen, die von Maschinen erarbeitet wurden. Programme liefern Filter, die den Zugang zu nach bestimmten Kriterien bearbeiteten Aufzeichnungen vereinfachen: Jeder Filter stellt auf unterschiedlichen Ebenen aggregierte Daten für differenzierte Synthesen bereit. Kurz: Begriffe wie Distant reading, Inhaltsmodellierung oder Wissensrepräsentation werden bald ebenso vertraut sein, wie Netzwerk und soziale Medien es heute schon sind. Das wiederum bedeutet, dass wir Computer konsequenterweise als Erweiterung unserer eigenen kognitiven Fähigkeiten wahrnehmen sollten, wie Anne Burdick, Johanna Drucker und ihre Kollegen vom MIT betonen.22
Aber: Wenn das Potenzial des digitalen Wandels so groß ist, weshalb setzt dann nicht auch die Historiographie schon längst auf den Einsatz von Algorithmen? Diese Frage lässt sich nur über den Umweg über das Selbstverständnis der Geschichtswissenschaft und über ihre produktive Voraussetzung beantworten: Eines ihrer Alleinstellungsmerkmale ist traditionell die Interpretation, das Erarbeiten eines tiefen Verstehens von einzelnen Quellen. Sie setzt also auf die qualitative Analyse primär in Einzelfällen. Demgegenüber steht die quantitative Analyse, die in der Regel nur dann Sinn macht, wenn ein umfangreicher Quellenkorpus verarbeitet wird. Und genau diese Voraussetzung muss für die Geschichte erst noch geschaffen werden: Quellen müssen digitalisiert und datafiziert werden. Dies ist eine überaus aufwendige und teure Aufgabe als Grundlage für quantitative historische Analysen. Überdies, das sei an dieser Stelle auch erwähnt, ist Sprache derart komplex, dass automatische inhaltliche Analysen das sorgfältige Lesen von Texten kaum je vollständig wird ersetzen können. Mehr dazu im Kapitel Close reading, im Perspektiventeil dieses Buches.
Dass sich der Aufwand für die Bereitstellung von digitalen Texten aber durchaus lohnen kann, zeigen Beispiele aus den Politischen Wissenschaften: Mosteller und Wallace haben schon 1963 automatisch die Autoren von nicht verzeichneten Federalist Papers erschlossen, in dem sie die Texte dieser Publikation als Daten repräsentierten. Sie haben dazu die funktionalen Wörter eines Textes ausgezählt und das Ergebnis einem Autor zugeordnet.23 Ein späteres, ausgefeiltes Beispiel für eine Inhaltsanalyse ist das Expressed Agenda Model von Justin Grimmer. Der amerikanische Politologe hat 2010 gemessen, welche Bedeutung US-amerikanische Senatoren bestimmten Themen geben. Als Quellenkorpus benutzte er Pressemitteilungen.24
Diese Entwicklung könnte zu einer Zweiteilung innerhalb der Geschichtswissenschaft führen. Das Szenario sieht so aus: Die Protagonisten für Datenanalysen übernehmen Aufgaben, die den quantitativ und empirisch arbeitenden Sozialwissenschaften nahe kommen. Sie untersuchen zum Beispiel die historische Ausbreitung von bestimmten kulturellen Mustern. Demgegenüber verteidigen die Vertreterinnen und Vertreter traditioneller heuristischer Ansätze die Bedeutung der Interpretation für die Forschung und den Zuwachs an historischem Wissen. Diese geisteswissenschaftliche Kompetenz sei wichtig, um Subjektivität, Mehrdeutigkeit und Komplexität als Aspekte der Forschung nicht aus dem Blick zu verlieren, argumentieren sie. Wohl zurecht: Das Wissen um die menschliche Dimension maschineller Verfahren ist gerade im digitalen Zeitalter besonders gefragt.
Diesen Punkt unterstreicht auch der Kulturwissenschaftler Gerhard Lauer. Für ihn ist die Digitalisierung zwar eine Revolution, welche die Hierarchie der geisteswissenschaftlichen Werte erschüttert. Die Aufmerksamkeit gilt neu dem digitalen Service am Text, das heißt seiner Standardisierung in Form von Daten und Metadaten, seiner algorithmischen Berechenbarkeit. Hermeneutisches Wissen...