Compartir:

Traductor multilingüe

Método de entrenamiento para sistemas de traducción automática neuronal multilingües que es fácilmente ampliable a nuevos idiomas y modalidades de datos. Ref: MKT2021/0177_I

 

 

Descripción de la Patente

Entrenar sistemas de traducción automática neuronal es desafiante tanto en términos de datos como de recursos computacionales. Estos factores se vuelven más críticos en un entorno multilingüe, donde varias lenguas pueden ser de entrada o generadas por el sistema. La estrategia más común consiste en entrenar un solo sistema de secuencia a secuencia compartido entre todas las lenguas. Esta arquitectura permite la transferencia de conocimientos, pero impone una dependencia entre las lenguas. Esta dependencia limita la capacidad del sistema para extenderse eficientemente a nuevas lenguas o modalidades. Todo el sistema debe ser reentrenado utilizando datos de todas las lenguas, lo que implica variaciones en el rendimiento general.

La Tecnología

Esta tecnología basada en la arquitectura de secuencia a secuencia para la traducción automática neuronal define cómo entrenar eficientemente un sistema multilingüe extensible a nuevas lenguas y modalidades permitiendo la transferencia de conocimientos. El proceso consta de dos pasos principales. En primer lugar, entrenamiento conjunto de codificadores y decodificadores específicos para cada lengua hasta una representación de lenguaje común sin compartir parámetros. En segundo lugar, entrenamiento incremental de nuevas lenguas y modalidades al sistema, incluyendo un módulo adicional para mitigar las diferencias entre las representaciones de discurso y texto.

Ventajas Innovadoras

Sistema de traducción automática neuronal multilingüe que es capaz de:

  • Converger a una representación de lenguaje común sin compartir parámetros entre lenguas.
  • Extenderse a nuevas lenguas a una fracción del costo de métodos anteriores.
  • Extenderse a lenguajes hablados incluso a pares de idiomas sin entrenamiento específico (es decir, traducción de cero).

Estado Actual de Desarrollo

La tecnología ha sido explorada y verificada mediante un sistema de prueba de concepto con resultados positivos en la traducción de texto y discurso. Se buscan colaboradores para continuar desarrollando el sistema y/o establecer acuerdos comerciales junto con cooperación técnica.

Aplicaciones y Mercado Objetivo

Este método podría aplicarse a cualquier solución de traducción automática disponible para aumentar la eficiencia de sus sistemas para extenderse a nuevas lenguas o modalidades de entrada.

Entrenamiento conjunto de varias lenguas

MKT2020-0173-R_acolchado sostenible invernadero.jpg

Entrenamiento incremental de nuevas lenguas. Permitiendo traducción de cero a todas las lenguas en el sistema.

Estatus de la Patente

Solicitud de prioridad US17229,657

Contacto

Mr. Gerard Margalef

Gerente de Licencias

T. +34 93 413 76 27

gerard.margalef@upc.edu