, , ,

Camembert oder Tortendiagramm? Woran KI-Übersetzung scheitert

Auf der Suche nach einem guilty pleasure mit positivem Effekt für meine Bildung habe ich mir die Sprachlern-App Duolingo heruntergeladen. Und dank dieser App habe ich tatsächlich viel gelernt, nur leider nicht unbedingt Französisch, wie ich kürzlich in Genf feststellen musste, wo ich die Eröffnungsrede am World Congress der International Federation of Translators hielt.

Move fast and break things?

Vor ein paar Monaten kündigte Duolingo an, menschliche Übersetzer künftig durch KI zu ersetzen. Der CEO formulierte es unverblümt:

„We’d rather move with urgency and take occasional small hits on quality than move slowly and miss the moment.“

Allein diese Aussage spricht Bände. Glaubt jemand im Jahr 2025 wirklich ernsthaft, eine Neuauflage des alten „move fast and break things“-Mottos sei noch akzeptabel? Angesichts des Shitstorms, den die Aussage ausgelöst hat, ist sie das offensichtlich nicht.

Doch wie sieht KI-Übersetzung eigentlich in der Praxis aus?

Camembert oder Tortendiagramm? Die KI weiss es nicht

Ein konkretes Beispiel aus der Duolingo-App zeigt das Problem sehr anschaulich:

Schritt 1: Eine Figur kündigt stolz eine „Degustation von Tortendiagrammen“ im Park an.

Schritt 2: Wenige Zeilen später wird der Begriff „camembert“ korrekt als Camembert übersetzt (das Wort ist auf französisch, deutsch und englisch gleich).

Schritt 3: Nur um dann gleich wieder als Tortendiagramm interpretiert zu werden.

Amüsant? Ja. Fast schon charmant. Und kaum überraschend, wenn man ein grosses Sprachmodell ist, das seine Besessenheit mit Statistik nicht verbergen kann.

Aber die Anekdote verdeutlicht noch etwas Grundsätzlicheres: KI übersetzt Wort für Wort – ohne jedes Gespür für Kontext, Tonfall oder Bedeutung.

Sie weiss nicht, was auf ein Daten-Dashboard gehört und was auf einen Käseteller. Genau darin liegt das Problem.

Diese Systeme verarbeiten Sprache aber sie verstehen die Welt nicht. Sie haben schlicht kein savoir vivre. So viel Französisch kann ich immerhin.

Was automatisieren wir eigentlich?

Diese kleine Anekdote führt zu einer grösseren Frage: Was genau automatisieren wir, wenn wir Übersetzung automatisieren?

Hilfreich ist eine Unterscheidung zwischen drei Arten von Automatisierung durch KI. Sie ist inspiriert von der „AI Snake Oil“-Debatte von Arvind Narayanan und Sayash Kapoor.

1. Wahrnehmung:

KI ist gut darin, Dinge zu erkennen – etwa Bilder zu klassifizieren oder Gesichter zu erkennen. Das sind Aufgaben, bei denen es klar richtige oder falsche Antworten gibt. Wenn genügend Daten vorhanden sind, performt die Maschine oft besser als Menschen – denn hier handelt es sich um Mustererkennung im grossen Massstab.

(Persönliches Geständnis: Ich bin gesichtsblind. Automatisierte Gesichtserkennung würde mir also einige peinliche Situationen ersparen – vorausgesetzt, man lässt mich dabei eure Privatsphäre verletzen).

2. Urteilsvermögen:

Komplizierter wird es, wenn KI eingesetzt wird, um Urteile zu fällen – etwa beim Bewerten von Aufsätzen, beim Erkennen von Spam oder eben: beim Übersetzen komplexer Texte.

Hier gibt es keine eindeutig richtige Antwort. Was für dich Spam ist, ist für mich vielleicht ein attraktives Investment-Angebot. Was für eine Lehrerin ein brillanter Aufsatz ist, kann für eine andere total am Thema vorbeigehen.

Wie also soll eine Maschine die Nuancen einer Übersetzung erfassen?

Es geht nicht nur um Wahrnehmung, sondern es geht um Urteilskraft: die Fähigkeit, Tonfall zu verstehen, Ironie zu bewahren und die passende kulturelle Referenz zu wählen.

3. Vorhersagen:

Schliesslich beanspruchen viele KI-Systeme heute, menschliches Verhalten vorhersagen zu können:

Wirst du einen Kredit zurückzahlen? Die Schule abbrechen? Dich scheiden lassen? Im Gefängnis landen?

Wenn es um Menschen geht, liegen diese Systeme jedoch oft nur knapp über Zufallsniveau. Man könnte genauso gut eine Münze werfen – aber es klingt eben wissenschaftlicher, wenn es ein Algorithmus tut.

Das fehlende Element: Urteilskraft

Kurz gesagt: Wenn wir KI zur Übersetzung einsetzen, reduzieren wir Sprache entweder auf Wahrnehmung – richtig oder falsch –, oder auf Vorhersage – wahrscheinlich oder unwahrscheinlich.

In beiden Fällen verlieren wir das Entscheidende: Urteilskraft.

Und diese Urteilskraft ist das, was menschliche Übersetzung – und menschliches Verstehen überhaupt – ausmacht. Sie erlaubt uns zu erkennen, ob ein Satz eine Metapher ist oder ein Menüpunkt.

Die Folgen sind gering, wenn es um Camembert versus Tortendiagramm geht. Aber sie werden gravierend, wenn dieselben Systeme in Gerichtsverfahren, im Bildungswesen oder im Gesundheitsbereich eingesetzt werden.

Dort wird aus einer Fehlübersetzung ein Fehlentscheid und der Unterschied zwischen reiner Sprachverarbeitung und Verständnis der realen Welt tritt schmerzhaft zutage.