Deep Learning revolutioniert Maschinenübersetzung

Ein deutsches Technologieunternehmen setzt mit Hilfe von Deep Learning einen neuen Standard in der Maschinenübersetzung.

2017 startete die DeepL GmbH den DeepL Übersetzer, ein maschinelles Übersetzungssystem auf Basis von neuronalen Netzen, das bisherige Übersetzungssysteme in der Qualität deutlich übertrifft. In Blindtests, in denen der DeepL Übersetzer mit bekannten Maschinenübersetzungen verglichen wurde, beurteilten professionelle Übersetzer die Ergebnisse von DeepL drei Mal häufiger als besser. Das belegen auch automatisierte Test. Im Bereich der maschinellen Übersetzung ist der Goldstandard für die Messung der Qualität der BLEU-Score, der maschinell übersetzte Texte mit denen eines Übersetzers vergleicht. Der DeepL Übersetzer erzielt auch bezüglich des BLEU-Scores Rekordwerte.*

„Wir haben einige bedeutende Verbesserungen an der Architektur der neuronalen Netze vorgenommen“, sagt Gereon Frahling, Gründer und Geschäftsführer des Unternehmens. „Durch eine neue Anordnung der Neuronen und ihrer Verbindungen haben wir es unseren Netzen ermöglicht, natürliche Sprache besser abzubilden als jedes bisherige neuronale Übersetzungsnetz.“

DeepLs künstliche Intelligenz läuft auf einem Supercomputer in Island, der 5.1 petaFLOPS (5 100 000 000 000 000 Operationen pro Sekunde) ausführen kann, genug Leistung, um eine Million Wörter in weniger als einer Sekunde zu übersetzen. „Aufgrund des Überangebots an erneuerbaren Energien können wir unsere neuronalen Netze in Island sehr kostengünstig trainieren. Wir werden dort weiterhin in leistungsstarke Hardware investieren“, erklärt CTO Jaroslaw Kutylowski.

Das DeepL Team nutzt diesen Supercomputer, um neuronale Netze mit einer riesigen Sammlung mehrsprachiger Texte zu trainieren. Die Netzwerke schauen sich dabei sehr viele Übersetzungen an und lernen selbständig, wie man grammatikalisch korrekt übersetzt und gute Formulierungen wählt. Dabei können die Kölner auf den Erfolg ihres ersten Produkts zurückgreifen: Linguee, der weltweit größten Suchmaschine für Übersetzungen. In den letzten zehn Jahren hat DeepL mehr als eine Milliarde hochqualitativer Übersetzungen zusammengetragen und kann diese nun zum Training der künstlichen Intelligenz nutzen.

Der DeepL Übersetzer unterstützt derzeit 42 Sprachkombinationen zwischen Deutsch, Englisch, Französisch, Spanisch, Italienisch, Polnisch und Niederländisch. Die neuronalen Netze trainieren bereits, um in Zukunft weitere Sprachen wie Mandarin, Japanisch und Russisch zu beherrschen. DeepL beabsichtigt außerdem, in den kommenden Monaten eine Programmierschnittstelle (API) zur Verfügung zu stellen. So kann die überlegene Übersetzungstechnik auch in anderen Produkten wie digitalen Assistenten, Wörterbüchern, Sprachlernanwendungen und professionellen Übersetzungsprogrammen eingesetzt werden.

„Unsere Ambitionen beschränken sich nicht auf Übersetzungen“, sagt Frahling. „Die neuronalen Netze haben ein unglaubliches Sprachverständnis entwickelt. Das eröffnet uns viele aufregende Möglichkeiten für die Zukunft.“

*) Der bisherige BLEU-Rekord auf den WMT 2014 newstest Testdaten für Englisch-Deutsch war 28,4, erreicht von der Google-Forschungsabteilung. Der öffentliche Übersetzungsdienst von DeepL erreicht auf den gleichen Testdaten eine BLEU-Punktzahl von 31,1. Auf den newstest 2014 Testdaten für Englisch-Französisch erreicht DeepL Translator eine BLEU-Punktzahl von 44,7 und übertrifft damit den bisherigen Rekord um mehr als 3 Punkte.

Deep Learning als relativ junge Disziplin innerhalb des Machine Learnings erweitert künstliche neuronale Netze um weitere Schichten (aus diesem Grunde das „Deep“) von Neuronen, die in der Lage sind, komplexe Eingaben (etwa Bilder) durch zahlreiche (Quer-)Verbindungen zu verarbeiten, um am Ende die gewünschte Ausgabe zu erzielen.

Jan Oevermann, tekom Schriften zur Technischen Kommunikation | Band 22, S. 83

 

Die große Herausforderung sind Aufgaben, die Menschen aufgrund ihrer Intuition und ihres Vorwissens ‚automatisch’ bewältigen, wie das Verstehen eines lücken- oder sogar fehlerhaften Textes oder das Erkennen einer Stimme, die aber formal nicht beschreibbar sind. Ein Ansatz für die Lösung solcher Aufgaben ist Deep Learning, ein Teilbereich des Maschinellen Lernens. Dabei lernen Systeme durch die Analyse massiver Datensammlungen und bauen schrittweise immer mehr Wissen auf. Basierend auf anfangs einfachen Konzepten entstehen auf diese Weise tiefe Hierarchien (daher der Name deep learning) von immer komplexeren Zwischenebenen, mit deren Funktionen gute Lernerfolge erzielt werden und die Lösung intuitiver Aufgabenstellungen möglich wird.

Sissi Closs, tekom Schriften zur Technischen Kommunikation | Band 22, S. 97 ff

Christian Pleschberger

Freier Redakteur, zertifizierter Technischer Redakteur bei satz KONTOR
DI Christian Pleschberger ist Absolvent der Universität für Bodenkultur, Freier Redakteur und zertifizierter Technischer Redakteur

Post Your Thoughts

This site uses Akismet to reduce spam. Learn how your comment data is processed.