Bahnbrechendes Forschungsprojekt zur Anwendung von Sprachtechnologie in Onlineforen mit ersten Resultaten und Beginn des Alpha-Releases der Technologie für Special Interest Group
Nach 12 Monaten kann das auf 36 Monate angelegte ACCEPT-Forschungsprojekt erste Ergebnisse vorweisen. Das Projekt untersucht und entwickelt neue Sprachtechnologien und Benutzeroberflächen für Foren und Benutzer von Community-Inhalten.
Ein besonderer Fokus liegt auf dem Optimieren maschineller Übersetzungsverfahren für diese Inhalte. Um dieses Ziel zu erreichen, konzentriert sich das Projekt hauptsächlich auf zwei Aspekte: Die Optimierung der Qualität des Ausgangsmaterials für eine bessere Übersetzbarkeit und die Weiterentwicklung der verfügbaren Technologien für Maschinelle Übersetzung (MT), insbesondere statistischer Übersetzungssysteme (SMT).
Die ersten Ergebnisse wurden vier verschiedenen Gebieten erzielt:
– Ein Pre-Editing-Plug-in für das Vorbearbeiten der erstellten Inhalte. Auf Basis der Acrolinx-Sprachtechnologie unterstützt das neue Plug-in Benutzer dabei, mit minimalem Zeitaufwand die gröbsten Fehler ihrer Inhalte zu korrigieren. Diese Balance zu finden ist eine der größten Herausforderungen des Projekts.
– Pre-Editing-Strategien für SMT. Acrolinx, Symantec und die Universität Genf haben die häufigsten Probleme untersucht, die bei der statistischen Maschinellen Übersetzung auftreten können. Außerdem wurde ermittelt, welche dieser Probleme sich automatisch und ohne Benutzereingaben beheben lassen. Aus den zur Verfügung stehenden Daten wurden Korrektur- und Umformulierungsmöglichkeiten extrahiert.
– Innovationen im Bereich der SMT-Technologie MOSES. Dieser von der Universität Edinburgh bearbeitete Projektbereich hatte zum Ziel, die optimale Datenkombination für die besten Ergebnisse aus benutzererstellen Inhalten zu ermitteln und Modelle zum Bearbeiten unbekannter Wörter zu entwickeln.
– Die Auswertungs-API liefert einen flexiblen Rahmen, um Benutzerfeedback aus Online-Inhalten, zum Beispiel Benutzerforen, zu sammeln. Die zum Gewinnen von Benutzerfeedback genutzten Fragen und Antworten werden vom ACCEPT-Portal selbst definiert.
Fred Hollowood von Symantec sagt dazu: „Benutzergenerierte Inhalte aus dem Bereich sozialer Netzwerke sind ein wichtiger Bestandteil optimaler Kundenbindung. Technologien zur Globalisierung dieses Kommunikationskanals sind ein Muss, weshalb wir uns sehr freuen, zur Forschung auf diesem Gebiet beizutragen.“ „Maschinelle Übersetzung (MT) wird uns noch länger begleiten“, so Lori Thicke, CEO von Lexcelera. „Dieses Projekt ist auch deshalb so wichtig, weil wir hier die Technologie aufbauen können, mit der wir MT für eine größere Zielgruppe attraktiv machen.“
Francis Tsang, Director of Globalization bei Adobe Systems, sagt dazu: „Als Nutzer von MT und Unternehmen mit einer klaren Strategie im Bereich benutzergenerierter Inhalte in unseren Produktforen sind wir sehr gespannt, wie sich diese Forschungsarbeit entwickelt und wie sich die Ergebnisse in unserer eigenen Umgebung umsetzen lassen. Wie Symantec haben auch wir eine weltweit aktive Community und sind überzeugt, dass wir unsere Nutzer durch die richtige Technologie besser unterstützen können.“
Die ACCEPT Special Interest Group
Mit den ersten sichtbaren Ergebnissen möchte die ACCEPT-Projektgruppe so schnell wie möglich auch Feedback von potenziellen Nutzern außerhalb des Projekts erhalten. Dafür wurde eine Special Interest Group (SIG) gegründet, zu der im ersten Quartal 2013 die ersten Mitglieder stoßen werden. Zusätzliche Mitglieder werden die Gruppe im Jahresverlauf 2013 vervollständigen. Die Reaktionen der Zielgruppe sind bereits in diesem frühen Stadium sehr gut. Symantec nimmt als Vertreter der Technologiebranche am Projekt teil, während staatliche und gemeinnützige Organisationen von Lexcelera und Translators without Borders vertreten werden.
Kollaboration führender Unternehmen auf dem Gebiet der Sprachtechnologie
Bei ACCEPT arbeiten Acrolinx, führender Anbieter von Content Optimization Software und die Universitäten Edinburgh und Genf, beide bekannt für ihre Forschung auf dem Gebiet der maschinellen Übersetzung, eng zusammen. Außerdem nehmen mit Symantec und Lexcelera zwei erfahrene Anwender maschineller Übersetzungssysteme am Projekt teil. Das von Lexcelera gegründete Translators without Borders und Symantec bringen ihre umfangreichen Erfahrungen mit Online-Communities und Internetforen mit ein.
Projektinformationen:
Website: http://www.accept.unige.ch
Koordinator: Prof. Pierrette Bouillon, accept@unige.ch
Pressekontakt des ACCEPT-Projekts:
Katja Höhne
Acrolinx
Friedrichstr. 100
DE-10117 Berlin
Deutschland
+49 30 288 8483 539
katja.hoehne@acrolinx.com
Acrolinx liefert Content Optimization Software, mit der Unternehmen wie Siemens, Philips, MAN, SEW-EURODRIVE, Danfoss, Stiebel Eltron, IBM, Adobe, Dell und Cisco verständliche Inhalte erstellen, die zudem günstiger zu übersetzen und besser zu finden sind. Um die Qualität der Inhalte zu analysieren und zu optimieren, kommt bei Acrolinx eine hochentwickelte, leistungsstarke linguistische Technologie zum Einsatz. Mehr Informationen unter: www.acrolinx.de
Kontakt:
Acrolinx
Ina Franke
Friedrichstr. 100
10117 Berlin
+49 (0)30 2888 483 527
ina.franke@acrolinx.com
http://www.acrolinx.de