2. Kapitel
Wandel
Luis von Ahn sieht aus wie ein typischer amerikanischer Collegestudent, und er verhält sich auch so. Er spielt gerne Videospiele. Er fährt einen blauen Sportwagen. Und wie ein moderner Tom Sawyer lässt er gerne andere für sich arbeiten. Aber der Schein trügt. Tatsächlich ist von Ahn einer der angesehensten Informatikprofessoren der Welt. Und er hat etwa eine Milliarde Menschen arbeiten lassen.10
Als 22-jähriger Student hat von Ahn vor einem Jahrzehnt etwas mitentwickelt, das CAPTCHA genannt wird: verzerrter Text auf einer Website, den man abtippen muss, um zum Beispiel eine kostenlose E-Mail-Adresse zu erhalten. So beweist man, dass man ein Mensch ist und kein Spambot. Bei der verbesserten Version namens reCAPTCHA, die von Ahn an Google verkauft hat, wurde das abzutippende Textfragment nicht eigens für diesen Zweck generiert, sondern aus Googles Buchdigitalisierungsprojekt extrahiert: ein Wort, das Googles OCR-Programm nicht lesen konnte. Das war eine schöne Methode, zwei Fliegen mit einer Klappe zu erschlagen: sich online für etwas zu registrieren und zugleich ein Wort zu entziffern.
Seither sucht von Ahn, inzwischen Professor an der Carnegie Mellon University, nach weiteren derartigen Anwendungen, bei denen zahlreiche Personen kleine Datenmengen beisteuern, die mehreren Zwecken dienen. Daraus hat er ein Start-up entwickelt, das 2012 gegründet wurde: Duolingo. Eine Website und eine Smartphone-App helfen beim Erlernen einer Fremdsprache – eine naheliegende Idee, zumal er selbst als kleiner Junge in Guatemala Englisch gelernt hatte. Aber der Unterricht erfolgt auf besonders clevere Weise.
Das Unternehmen lässt die Leute kurze Textabschnitte übersetzen oder aber die Übersetzungen anderer Personen überprüfen und korrigieren. Statt erfundene Sätze zu präsentieren, wie es für Sprachlernsoftware typisch ist, verwendet Duolingo echte Sätze aus Dokumenten, für deren Übersetzung das Unternehmen von seinen Kunden bezahlt wird. Sobald hinreichend viele Sprachschüler einen bestimmten Satz unabhängig voneinander gleich übersetzt oder verifiziert haben, akzeptiert das System ihn, und dann fügt es all die Einzelsätze zum fertigen Dokument zusammen.
Zu den Kunden zählen Medienunternehmen wie CNN und BuzzFeed, die ihre Texte so für den Einsatz in fremdsprachigen Märkten aufbereiten. Wie reCAPTCHA lebt Duolingo von einer reizvollen Win-win-Situation: Die Schüler erhalten kostenlosen Fremdsprachenunterricht und erzeugen im Gegenzug etwas, das einen Marktwert hat.
Aber es gibt noch einen dritten Nutzen. Duolingo sammelt alle Daten der Besucher der Website: Informationen darüber, wie lange jemand braucht, um einen bestimmten Aspekt einer Sprache zu beherrschen, wie viel man idealerweise übt, welche Folgen ein paar Tage Auszeit haben und so weiter. Von Ahn hat erkannt, dass diese Daten – richtig aufbereitet – zeigen können, wie Menschen am besten lernen. In einem nicht digitalen Umfeld wäre das schwer zu bewerkstelligen. Aber da Duolingo 2013 etwa eine Million Besucher pro Tag hatte, die jeweils über eine halbe Stunde auf der Website verweilten, konnte von Ahn eine riesige Population untersuchen.
Die wichtigste Erkenntnis, die er dabei gewonnen hat: Schon die Frage »Wie lernen Menschen am besten?« ist falsch gestellt. Es geht nicht darum, wie »Menschen« am besten lernen, sondern darum, wie welcher Mensch am besten lernt. Ihm zufolge wurde nur in wenigen Studien empirisch erforscht, wie man eine Fremdsprache am besten lehrt. Stattdessen gibt es eine Fülle von Theorien, denen zufolge beispielsweise die Adjektive vor den Adverbien behandelt werden sollten. Aber es mangelt an harten Fakten, sagt von Ahn. Und da, wo es doch Daten gibt, stammen sie für gewöhnlich aus so kleinen Studienpopulationen – etwa von wenigen Hundert Studenten –, dass sich daraus kaum belastbare Aussagen ableiten lassen. Warum also nicht die Daten von einigen Dutzend Millionen Sprachschülern über einige Jahre hinweg sammeln, um zu verlässlicheren Schlussfolgerungen zu gelangen? Duolingo macht das jetzt möglich.
Bei der Verarbeitung von Duolingos Daten entdeckte von Ahn etwas Bedeutendes: Die beste Methode, eine Sprache zu lehren, hängt sowohl von der Muttersprache der Schüler als auch von der Fremdsprache ab. Wer etwa einem spanischen Muttersprachler Englisch oder Deutsch beibringen will, nimmt die Personalpronomina – Wörter wie »er«, »sie« und »es« – für gewöhnlich früh dran. Das Wort »es« aber verwirrt und verunsichert viele Menschen, die mit Spanisch aufgewachsen sind, da es in ihrer Muttersprache so nicht vorkommt. Daher hat von Ahn ein paar Tests durchgeführt und dabei festgestellt: Zunächst nur »er« und »sie« zu lehren und die Einführung des »es« um ein paar Wochen zu verschieben, verringert die Abbrecherquote von Sprachschülern mit Spanisch als Muttersprache ganz erheblich.
Einige Ergebnisse sind das genaue Gegenteil dessen, was man erwartet: Frauen sind bei Sportvokabeln besser, Männer führen bei den Wörtern, die sich aufs Kochen und Essen beziehen. In Italien lernen Frauen leichter Englisch als Männer. Und es tauchen ständig neue Einsichten dieser Art auf.
Die Geschichte von Duolingo illustriert einen der vielversprechendsten Wege, auf denen Big Data die Bildung umgestaltet, und zeigt die drei wesentliche Eigenschaften von Big Data auf, die das Lernen verbessern werden: Feedback, Individualisierung und auf Wahrscheinlichkeiten basierende Vorhersagen.
Feedback
Unser Bildungsweg ist vom Kindergarten bis zum Universitätsabschluss mit Feedback durchtränkt. Wir bekommen Noten für unsere Hausaufgaben, für unsere Mitarbeit im Unterricht, für Aufsätze und Prüfungen. Manchmal erhalten wir sogar für bloße Anwesenheit eine Note. Während unserer Schul- und Hochschullaufbahn sammeln wir Hunderte solcher Datenpunkte an – »Small Data«-Signale, die anzeigen, wie gut unsere Leistung in den Augen unserer Lehrer war. Wir haben uns daran gewöhnt, auf dieses Feedback zu vertrauen, um unsere schulische Leistung zu beurteilen. Dabei ist dieses Feedbacksystem in so ziemlich jeder Hinsicht unzureichend.
Denn wir sammeln oft nicht die richtigen Informationen. Und selbst wenn wir das Richtige sammeln, bekommen wir nicht genug davon zusammen. Und dann werten wir die gesammelten Daten nicht effektiv aus.
Das ist aberwitzig. Unsere iPhones haben weitaus mehr Rechenleistung als der NASA-Großrechner, der Astronauten sicher zum Mond und zurück gelenkt hat. Tabellenkalkulationsprogramme und Grafik-Tools können heute unglaublich viel. Aber den Schülern, Eltern und Lehrern einen benutzerfreundlichen, umfassenden Überblick über die Tätigkeiten und Leistungen der Schüler an die Hand zu geben, scheint nach wie vor Science Fiction zu sein.
Das Seltsamste am Feedback im heutigen Bildungssystem ist, was wir messen. Wir messen schulische Leistung und machen die Schüler für die Ergebnisse verantwortlich. Wie gut wir unsere Kinder unterrichten, erfassen wir dagegen selten – in großem Stil praktisch nie. Wie sehr der Unterricht – vom Lehrbucheinsatz über Tests bis zu dem, was Lehrer in der Klasse tatsächlich sagen – das Lernen fördern, wird hingegen kaum bewertet. In den Zeiten von »Small Data« war es viel zu kostspielig und aufwendig, die nötigen Daten zusammenzutragen. Also maßen wir das, was sich leicht messen ließ, zum Beispiel im Zuge von Prüfungen. Feedback floss fast immer in eine Richtung: von Lehrern und Schulen zu den Kindern und ihren Eltern.
In jedem anderen Gebiet käme uns das seltsam vor. Kein Hersteller oder Verkäufer bewertet ausschließlich seine Kunden. Wenn sie sich um Feedback bemühen, dann vor allem über sich selbst: über ihre Produkte und Dienstleistungen, mit dem Ziel, diese zu verbessern. Im Kontext des Lernens wird dagegen primär bewertet, wie gut jemand nach Ansicht des Lehrers oder der Lehrerin seine oder ihre Lektion verstanden hat – am liebsten durch unregelmäßige, standardisierte Tests. Wie gut der Stoff vermittelt wurde und ob die eingesetzten Lehrmittel für den jeweiligen Schüler gepasst haben, wird nicht abgefragt. Das Feedback dreht sich um die Resultate, nicht um den Prozess des Lernens. Denn die dafür nötigen Daten zu erheben und auszuwerten, gilt als schwierig.
Big Data ändert das. Wir können Daten zu Aspekten des Lernens sammeln, die uns früher verschlossen blieben. Wir »verdaten« den Lernvorgang. Und wir können die Daten jetzt auf neue Weise verknüpfen und die Ergebnisse sowohl den Schülern geben, damit sie mehr verstehen und leisten, als auch den Lehrern und Entscheidungsträgern zukommen lassen, damit sie das Bildungssystem verbessern.
Das Lesen ist ein gutes Beispiel. Ob jemand eine bestimmte Textstelle mehrmals las, weil er sie so schön fand oder weil sie schwer verständlich war, ließ sich bisher nicht unterscheiden. Haben Schüler Randnotizen zu bestimmten Absätzen gemacht, und wenn ja, wieso? Haben einige Leser die Lektüre abgebrochen, und wenn ja, an welcher Stelle? An all diese aufschlussreichen Informationen war bis zur Erfindung des E-Books schwer heranzukommen.
Wird hingegen das Lehrbuch auf einem Tablet oder Computer gelesen, kann man derartige Signale sammeln, verarbeiten und einsetzen, um Schülern oder Studenten, Lehrern und Verlagen Feedback zu geben. Kein Wunder also, dass die großen Schul- und Lehrbuchverlage in den E-Lehrbücher-Markt drängen. Unternehmen wie Pearson, Kaplan und McGrawHill benötigen Daten über den Einsatz ihrer Lehrmittel, um...