angle-uparrow-clockwisearrow-counterclockwisearrow-down-uparrow-leftatcalendarcard-listchatcheckenvelopefolderhouseinfo-circlepencilpeoplepersonperson-fillperson-plusphoneplusquestion-circlesearchtagtrashx

DeepL API Maschinelle Übersetzungen etwas besser machen

Wir können keine guten Übersetzungen von einer Maschine erwarten, wenn sie den Kontext nicht kennt.

31 August 2019 Aktualisiert 6 September 2019
post main image
unsplash.com/@danielkorpai

Natürlich ist nichts vergleichbar mit einer Übersetzung durch einen professionellen Übersetzer. Maschinelle Übersetzung ist schwierig. DeepL versucht, Übersetzungen durch maschinelles Lernen zu verbessern, aber sie sind noch weit davon entfernt, den richtigen Kontext zu verwenden.

Lassen Sie mich Ihnen ein Beispiel nennen. Diese Website ist über Python, Flask, Computernetzwerk, etc. DeepL weiß dies nicht, weil wir es nicht sagen können. Aber es sollte es wissen! Der Begriff ''Flaskkann maschinell übersetzt werden in 'Flasche' (Flasche) auf Deutsch. Der Begriff 'Python hat Räder' kann maschinell übersetzt werden in: 'Python hat Räder'. Der Begriff ''port 25kann maschinell übersetzt werden in: Hafen 25'. Alle sind falsch. DeepL Hätte diese nicht übersetzen sollen, aber woher soll sie das wissen?

Übersetzungskontext

Es gibt nur einen Weg, um eine bessere Übersetzung zu erhalten, und zwar durch die Bereitstellung eines Übersetzungskontextes an DeepL. in diesem Fall zum Beispiel: translate_for_context: 'Python, ', 'Flask.... Eine andere Möglichkeit wäre, einige Seiten der Website zu geben DeepL und sie den Kontext selbst bestimmen zu lassen. Beides ist im Moment leider nicht möglich.

Ich habe über Leute gelesen, die Übersetzungen mit Google Translate vergleichen DeepL . Ja, DeepL scheint ein besserer Kontextübersetzer zu sein (manchmal), aber ist es immer eine gute Idee, zu versuchen, innerhalb eines Kontextes zu übersetzen? Und was ist der Kontext in diesem Fall? Und weiß ein menschlicher Übersetzer dann noch, was die Absicht des Originaltextes ist?

Bessere Übersetzungen

Wie können wir also die oben genannten Probleme vermeiden und eine bessere oder gar keine Übersetzung erhalten? DeepL schlägt vor, dass Sie Wörter, die Sie nicht übersetzen möchten, zwischen Tags setzen, z.B. <x> und </x>, und dann diesen Tag zu den ignore_tags-Parametern hinzufügen. Das wird funktionieren, ist aber eine Menge Arbeit. In jedem Text müssen wir Tags für Wörter einfügen, die wir nicht übersetzen wollen. Ich möchte meine Texte nicht mit Do-not-translate Tags verunreinigen.

Diese Website hat Blog-Posts über Python, Flask,, etc. Anstatt also Tags in alle Blog-Posts zu setzen, können wir eine Liste reservierter Wörter erstellen, was bedeutet: Übersetzen Sie diese Wörter nicht. Das ist noch viel Arbeit, denn wir müssen auch unseren Blog-Post-Text auf Wörter überprüfen, die wir nicht übersetzen wollen. Aber es scheint ein vernünftiger Weg zu sein, eine erste Version eines übersetzten Textes zu bekommen. Und die Arbeit, die wir jetzt machen, muss nicht mit den nächsten Blog-Posts erledigt werden.

Eine Liste der reservierten Wörter

Ich erstellte eine Liste von reservierten Wörtern und ersetzte sie durch unübersetzbare Tags, bevor ich den Text an den DeepL APIText weitergab, was bedeutete, dass ich die Standardtexte (Englisch) Satz für Satz, Wort für Wort durchgehen musste. Auf diese Weise habe ich eine Liste von etwa 100 reservierten Wörtern und Begriffen erstellt, darunter ' ' 'many-to-many, ' ' 'port 25'multistage, ' ' ' 'netmask, etc. Ich musste auch sicherstellen, dass ich keine unterschiedlichen Versionen dieser Begriffe wie MariaDBMariadb, MariaDb hatte. Die resultierenden Übersetzungen sind jetzt viel besser, aber die Texte sind noch lange nicht akzeptabel. Was ich wirklich brauche, sind Listen. Eine Liste, die alle Schlüsselwörter für Python, eine Liste, die alle Schlüsselwörter für Flask, eine Liste, die alle Schlüsselwörter für Computer-Netzwerk-Begriffe enthält, und einige dieser Listen müssen auch Übersetzungen haben, da nicht alle Begriffe in einer anderen Sprache auf Englisch sein können. Und dann muss ich noch selbst Wörter ausschließen, weil sie mit dem Blogbeitrag selbst zusammenhängen und nicht in einer Liste stehen.

Zusammenfassung

Die Ergebnisse der maschinellen Übersetzung mögen für natürliche Sprache akzeptabel sein, aber sie sind sicherlich nicht gut genug für technische Texte wie auf dieser Website. Es wäre schön, wenn wir einen Kontext liefern DeepL könnten (Python, FlaskVernetzung, etc.) oder in der Lage wären, diesen Kontext selbst DeepL bestimmen zu lassen, z.B. durch die Bereitstellung einiger verwandter Webseiten. Obwohl meine Website eher ein Schaufenster ist, möchte ich, dass die Übersetzungen akzeptabel sind. Für die nächsten Blog-Posts werde ich weiterhin reservierte Wörter zu meiner Liste hinzufügen, aber auch dem DeepL Rat folgen, Tags um Wörter zu setzen, die ich nicht übersetzen möchte. Aber nicht zu viel.

Links / Impressum

DeepL
https://www.deepl.com/home

Mehr erfahren

DeepL

Einen Kommentar hinterlassen

Kommentieren Sie anonym oder melden Sie sich zum Kommentieren an.

Kommentare

Eine Antwort hinterlassen

Antworten Sie anonym oder melden Sie sich an, um zu antworten.