Datenjournalismus gibt es, seitdem es Daten gibt - zumindest aber seit den Grafiken derenglischen Krankenschwester Florence Nightingale und den dazugehörigen Berichten überdie Bedingungen und Missstände britischer Soldaten in Lazaretten im Krimkrieg (1853 bis 1856). Diesen Zeitpunkt nehmen zumindest viele Datenjournalisten als Startschuss für datengetriebenen Journalismus wahr.
Abbildung 2: Polar-Area-Diagram zeigt Todesursachen von Soldaten während des Krimkrieges. Quelle: Notes on Matters Affecting the Health, Efficiency, and Hospital Administration of the British Army (1858)
In der Grafik (siehe Abb. 2) zeichnete Nightingale die verschiedenen Todesursachen der Soldaten während des Krimkrieges auf. Blau dargestellt sind alle Todesfälle durch Infektionskrankheiten. Die roten Flächen zeigen die Anzahl der Soldaten, die an Verwundungen gestorben sind. Die schwarzen Areale beziehen sich auf Soldaten, die aus anderen Gründen ihr Leben gelassen haben.
Damals hätte wohl niemand Florence Nightingale als Journalistin bezeichnet, geschweige denn als Datenjournalistin. Erst 2010 charakterisierte der britische Guardian[11] Nightingale als Wegbereiterin der visuellen Darstellungen von Statistiken in diesem Bereich. Heutzutage machen Datenjournalisten jedoch nichts anderes als Nightingale schon vor über 150Jahren: Sie sammeln Daten und visualisieren diese. Der Unterschied zu damals ist: Früher waren solche Grafiken nahezu ausschließlich in Büchern zu finden, die sehrteuerwaren. Mittlerweilearbeiten Datenjournalisten mitTabellen und Dateien, die maschinenlesbar sind und von Computern auf einfache Art bearbeitet und als Grafik herausgegeben werden können.
Das ist zum einen unumgänglich, da der Fortschritt kaum aufzuhalten ist. Zum anderen aber auch erforderlich, da die Datenmengen kontinuierlich und stetig wachsen. Nach einer Studie der University of Southern California wurden 2002 erstmals mehr digitale als analoge Daten gespeichert. Fünf Jahre später wurden fast 94 Prozent aller Informationen in digitaler Form aufbewahrt, was 295 Exabyte entspricht[12]. Im vergangenen Jahr produzierte die Weltbevölkerung laut einer aktuellen Studie des Marktforschungsinstitutes IDC im Auftrag der EMC Corporation ein Datenvolumen von 1,8 Zettabyte[13] (siehe Abb. 3). Allein das mobile Datenvolumen soll laut Netzwerkausrüster Cisco Systems bis zum Jahr 2016 um das Achtzehnfache auf 130 Exabyte ansteigen[14].
Abbildung 3: Die Grafik zeigt, wie viel eine Person twittern bzw. wie viele Jahre eine Person 120 Minuten lange Filme in HD-Auflösung schauen müsste, um 1,8 Zettabyte Daten zu verbrauchen. Quelle: Catone, Josh: How Much Data Will Humans Create & Store This Year?
Genau hier liegt die Chance für den Datenjournalisten, der als Schnittstelle zwischen den immens hohen Datenbergen und dem Rezipienten fungiert. Erfindet eine Geschichte im Informationschaos, in dem er die Daten sortiert und filtert.
Datenjournalismus wird aktuell in nahezu jedem Beitrag über die Zukunft des Journalismus erwähnt. Er ist weit mehr als nur eine Modeerscheinung. Auch Lorenz Matzat, einer der wenigen führenden Datenjournalisten in Deutschland, sieht hier großes Potenzial:
„Natürlich ist Datenjournalismus zur Zeit schon auch ein Modethema. Aber er wird nicht wieder verschwinden: Er eröffnet neue Perspektiven, gleichzeitig nehmen Datensätze immer mehr zu und damit auch der Bedarf, diese zu erklären."[15]
Vor allem im Bereich des Online-Journalismus werden aktuell viele Datenprojekte realisiert. Immer wieder trifft man im Internet auf Visualisierungen von banalen bis hin zu komplexen Themen. Die Verfasser dieser Datenartikel sind hierzulande aber bislang stets dieselben. Nur langsam wagen Redaktionen den Schritt in die Welt von Statistiken, Datenbergen und Programmiersprachen.
Redaktionen von Süddeutschere, taz.de und Zeit Online sind in Deutschland eine Art Vorreiter in Sachen Datenjournalismus. Hier entstehen große Projekte wie „der Zugmonitor", das bereits angesprochene „verräterische Handy" oder „die Fluglärmkarte". Bei allen drei Projekten waren es aber weniger die Redaktionen der großen Verlage, die hinter der Realisierung steckten. Stattdessen taucht ein Name immer wieder in Verbindung mit aufwendig produzierten Datenartikeln auf: OpenDataCity.
Wenn man so möchte, ist OpenDataCity momentan die Agentur in Deutschland, die Datenjournalismus in Perfektion betreibt - zumindest im Online-Bereich.
Ein Beispiel dafür ist der Zugmonitor (siehe Abb. 4), der auf Süddeutsche.de erschienen ist. In dieser Anwendung werden Züge der Deutschen Bahn live auf einer Karte dargestellt. Der Leser respektive Nutzer dieser Anwendung sieht, ob Züge pünktlich in den Bahnhof einlaufen oder um wie viele Minuten sie sich verspäten. Zudem lassen sich dank integrierter Suche auch Bahnhöfe, Zeiträume und Zugnummern anzeigen, die in der Vergangenheit liegen. Süddeutsche.de und OpenDataCity geben dem Nutzer sogar die Möglichkeit, die Daten perApplication Programming Interface (API) in eine eigene Anwendung zu integrieren.
Abbildung 4: Zugmonitor: So pünktlich ist die Bahn Quelle: http://zugmonitor.sueddeutsche.de [Abruf06.08.2012]
So etwas wäre laut Stefan Plöchinger, Leiter der Onlineredaktion von Süddeutschere, vor einigen Jahren noch nicht möglich gewesen[16]:
„Der jetzt in Betrieb genommene SZ-Zugmonitor leistet auf ungekannte Art eine Übersetzungsarbeit, die in einem sehrtraditionellen Sinnejournalistisch ist: Ein kompliziertes Geschehen wird vereinfacht und der Öffentlichkeit nahe gebracht. Gigantische, komplexe Datenmengen werden aus bis dato nicht erschließbaren Quellen gesammelt, sortiert, gefiltert, neu verpackt und in plötzlich verständlicher Form ausgespuckt."[17]
Im Internet findet man immer mehr solcher interaktiver Datenanwendungen, die in Printmedien schwer bis gar nicht realisierbar sind. Nur hin und wieder tauchen in Zeitungen oder Zeitschriften Landkarten auf, die auf Basis zahlreicher Daten etwas darstellen und als Ergänzung zum Artikel stark verdeutlichen können. Die Interaktivität bleibt jedoch auf der Strecke.
Seit einiger Zeit häufen sich Infografiken (siehe Abb. 3), die dem Leser auf spielerische und bildliche Weise viele Zahlen und Fakten präsentieren. Meist jedoch sind es nur aus dem Text übertragene Daten in eine Grafik, die zwar hübscher aussieht, aber von vielen nicht als Datenartikel angesehen wird. Zudem erwähnt Lorenz Matzat immer wieder: „Datenjournalismus funktioniert nur online."[18]
Für ihn sind Klickstrecken, Bewegtbild oder Podcasts nur Remixe althergebrachter Medienformate. Datenjournalismus dagegen setze auf Datenbanken und Interaktivität, die nur im Browser oder einer Applikation (App) funktionieren könne.[19]
„Eine klickbare Karte ist zwar interaktiv, aber noch lange kein wirklicher Datenjournalismus, genauso wenig wie ein Balken- oder Tortendiagramm."[20]
Für Matzat ist es von hoher Bedeutung, ob einer oder mehrere Datensätze eine zentrale Rolle spielen, ob das Angebot interaktiv, für den Rezipienten durchsuchbar und die einzelnen Parameter festlegbar sind und ob der Datensatz, der zur Erstellung der Datenanwendung benutzt wurde, einsehbar ist oder sogar vom Nutzer heruntergeladen und womöglich unter einer freien Lizenz weiterverwendet werden kann.[21]
Dem halten viele Journalisten entgegen und versuchen, den Datenjournalismus auch im Printbereich zu etablieren. Bereits im Jahr 1993 gewann „The Miami Herald" den Pu- litzer-Preis für die Berichterstattung (siehe Abb. 5) über den im August 1992 wütenden Hurrikan Andrew, der als der Wirbelsturm gilt, der im 20. Jahrhundert in den USA und der Karibik die größten Zerstörungen angerichtet hat. Nachdem die Zeitung 50.000 Berichte ausgewertet, Katasterpläne angefordert, Bauherren befragt und insgesamt vier Datenbanken aufgebaut, gefiltert und letztendlich visualisiert hat, kamen überraschende Details ans Licht: In Gebieten, in denen der Wind schwächer war, wurden mehr Häuser zerstört als in der Schneise, die der Wirbelsturm hinterließ. Darüber hinaus hatten Häuser, die nach 1980 gebaut wurden, eine dreifach höhere Wahrscheinlichkeit unbewohnbar zu sein als jene, die vor 1980 errichtet wurden.[22]
Datenjournalismus funktioniert also nicht nur online, sondern auch auf Papier. Der Unterschied: Online funktioniert er anders, die Schnittstelle zum Leser ist auf einmal da - Interaktion wird möglich und ist auch gewollt; im Printmedium ist dies nicht möglich.
Ein weiterer Aspekt ist, dass Datenjournalismus nicht unbedingt etwas Neues ist, wie der Zeitungsbericht des Miami Herald verdeutlicht. Es ist durch den technischen Fortschritt nur einfacher geworden, Daten zu sammeln und...