angle-uparrow-clockwisearrow-counterclockwisearrow-down-uparrow-leftatcalendarcard-listchatcheckenvelopefolderhouseinfo-circlepencilpeoplepersonperson-fillperson-plusphoneplusquestion-circlesearchtagtrashx

Mejorar un poco las traducciones DeepL API automáticas

No podemos esperar buenas traducciones de una máquina cuando no conoce el contexto

31 agosto 2019
post main image
unsplash.com/@danielkorpai

Por supuesto, nada se compara con una traducción realizada por un traductor profesional. La traducción automática es difícil. DeepL trata de mejorar las traducciones mediante el aprendizaje automático, pero todavía están muy lejos de utilizar el contexto adecuado.

Permítanme darles un ejemplo. Este sitio web se trata de Python, , Flask, red informática, etc. DeepL no lo sabe porque no podemos contarlo. ¡Pero debería saberlo! El término "Flasche"Flask(botella) puede traducirse mecánicamente en alemán. El término "Python tiene ruedas" puede ser traducido mecánicamente: "Python sombrero Räder". El término ' 'port 25puede ser traducido mecánicamente: Hafen 25". Todos están equivocados. No DeepL debería haber traducido estos, pero ¿cómo puede saber esto?

Contexto de la traducción

Sólo hay una manera de conseguir una mejor traducción y es proporcionando un contexto de traducción a DeepL. En este caso, por ejemplo: translate_for_context: 'Python, 'Flask. Otra forma sería dar DeepL algunas páginas del sitio web y dejar que éste determine el contexto mismo. Lamentablemente, ambas cosas no son posibles en este momento.

He leído que la gente compara DeepL la traducción con la traducción de Google Translate. Sí, DeepL parece un mejor traductor de contextos (a veces), pero ¿es siempre una buena idea intentar traducir dentro de un contexto? ¿Y cuál es el contexto en este caso? ¿Y un traductor humano sabe entonces cuál es la intención del texto original?

Mejores traducciones

Entonces, ¿cómo podemos evitar los problemas anteriores y obtener una mejor traducción, o ninguna traducción? DeepL sugiere que pongas palabras que no quieres que se traduzcan entre las etiquetas, por ejemplo, <x> y </x>, y luego agregues esta etiqueta a los parámetros ignore_tags. Esto funcionará, pero es mucho trabajo. En cada texto debemos insertar etiquetas para las palabras que no queremos traducir. No quiero contaminar mis textos con etiquetas de"no traducir".

Este sitio web tiene entradas de blog acerca Pythonde , Flask, etc. Así que en lugar de poner etiquetas en todas las entradas del blog podemos crear una lista de palabras reservadas, es decir: no traduzcas estas palabras. Esto sigue siendo mucho trabajo porque también debemos revisar el texto de nuestro blog en busca de palabras que no queremos que se traduzcan. Pero parece una manera razonable de obtener una primera versión de un texto traducido. Y el trabajo que hacemos ahora no tiene que hacerse con las próximas entradas del blog.

Una lista de palabras reservadas

Creé una lista de palabras reservadas y las reemplacé con etiquetas intraducibles antes de alimentar el texto a la DeepL APIpágina web, lo que significaba que tenía que repasar los textos por defecto (en inglés) frase por frase, palabra por palabra. De esta manera creé una lista de unas 100 palabras reservadas, términos, entre los que se incluyen 'many-to-many, 'port 25, ', 'multistage, ', ',''netmask, etc. También tuve que asegurarme de no tener versiones diferentes de estos términos, como MariaDB, Mariadb, MariaDb. Las traducciones resultantes son ahora mucho mejores, pero los textos aún están lejos de ser aceptables. Lo que realmente necesito son listas. Una lista que contiene todas las palabras clave para Python, una lista que contiene todas las palabras clave para, una lista que contiene todas las palabras clave para Flask, una lista que contiene todas las palabras clave para términos de redes de computadoras, y algunas de estas listas también deben tener traducciones porque no todos los términos pueden estar en inglés en otro idioma. Y entonces todavía debo excluir las palabras yo mismo porque están relacionadas con la entrada del blog en sí y no están en una lista.

Resumen

Los resultados de la traducción automática pueden ser aceptables para el habla natural, pero ciertamente no son lo suficientemente buenos para textos técnicos como los de este sitio web. Sería bueno si pudiéramos proporcionar DeepL un contexto (Python, , Flask, networking, etc.) o ser capaces de DeepL determinar este contexto por sí mismos, por ejemplo, mediante el suministro de algunas páginas web relacionadas. Aunque mi sitio web es más como un escaparate, ciertamente quiero que las traducciones sean aceptables. Para las próximas entradas del blog seguiré añadiendo palabras reservadas a mi lista, pero también seguiré el DeepL consejo de poner etiquetas alrededor de las palabras que no quiero que se traduzcan. Pero no demasiado.

Enlaces / créditos

DeepL
https://www.deepl.com/home

Leer más

DeepL

Deje un comentario

Comente de forma anónima o inicie sesión para comentar.

Comentarios

Deje una respuesta.

Responda de forma anónima o inicie sesión para responder.