Un algoritmo creado por traductores es el invento más demandado de la UMA

El grupo Lexytrad ha firmado 20 licencias de explotación de la patente desde 2015, frente a las 36 suscritas en la historia de la universidad.

La catedrática Gloria Corpas, en la Facultad de Filosofía y Letras, donde dirige un equipo de 14 personas.
Encarna Maldonado, Málaga

31 de octubre 2016 - 01:00

La catedrática Gloria Corpas es la impulsora de la patente más licenciada de la Universidad de Málaga. La singularidad de la gesta reside en que la investigadora y su grupo Lexytrad no pertenecen al campo de las ingenierías, sino a las humanidades, pero han inventado el algoritmo NCor que hace furor entre los traductores. Desde enero de 2015 hasta el pasado 13 de octubre han firmado 20 licencias de explotación. La UMA en toda su historia solo suscrito 36 acuerdos con terceros para que sus inventos lleguen al mercado.

NCor es el corazón de una herramienta denominada ReCor que permite establecer el tamaño mínimo de un corpus o texto electrónico que contiene muestras reales del uso de la lengua para que los traductores puedan comprender el contexto de las palabras. Un ejemplo: si durante una conversación un inglés le espeta "Let me twist your arm", no salga corriendo. No pretende retorcerle el brazo, sino convencerle de algo. En cualquier caso es un malentendido menor. Sin embargo, ¿qué sucede si su médico decide reducir su resistencia a la insulina con thiazolidinediones porque en un artículo médico traducido del inglés ha leído que es una solución eficaz? En ese caso sí que interesa mucho que la traducción no encierre ninguna ambigüedad. Los corpus tienen la misión, precisamente, de mostrar al profesional el contexto de cada término y las sutilezas que encierra su significado. "Son representativos del estado de la lengua en cada especialidad", subraya Gloria Corpas. También proporcionan definiciones especializadas, cognados o palabras con la que comparten significado, ortografía y pronunciación (como circulación y circulation en inglés), así como fraseología o expresiones características de una lengua. A mayor complejidad del un texto, más importante es disponer de un buen corpus.

El invento Gloria Corpas y su equipo tiene la bondad de establecer el umbral a partir del cual ese texto es representativo y, por tanto, válido. La patente la solicitó en 2006, se aprobó su registro en 2010 y hasta el año pasado el grupo la ha proporcionado gratis a todos aquellos profesionales e investigadores interesados, así como a empresas, entre las que destaca la agencia catalana de noticias. El año pasado, sin embargo, la catedrática optó distribuir su invento gratuitamente pero mediante licencia porque es la única fórmula que les permite medir la transferencia de tecnología que realizan. Desde entonces se han cerrado 18 acuerdos y tienen dos más en trámite. La herramienta ha sido pedida fundamentalmente por investigadores y traductores profesionales de otros países.

La catedrática está al frente del único grupo de la Universidad de Málaga que ha construido una trayectoria científica en el campo del procesamiento del lenguaje natural, un área que combina la computación y la inteligencia artificial con la lingüística aplicada. El resultado son máquinas y aplicaciones capaces de entender y explotar el lenguaje natural.

Lexytrad está constituido por 14 personas. Aunque la mayoría son expertos en lengua y traducción, cuenta con el catedrático de lingüística computacional de la universidad británica de Wolverhampton Ruslan Mitkov, que mantiene una línea de colaboración permanente a través de estancias científicas sufragadas primero por el Ministerio de Economía y después por el campus de excelencia internacional Andalucía Tech. También integra a un informático y a dos becarios predoctorales del prestigioso programa europeo Marie Curie, uno de los cuales también procede del área de la computación. Además, en la actualidad está en proceso de selección de otro becario predoctoral que responda a ese perfil.

Gloria Corpas ha sido la investigadora principal de 11 proyectos científicos con los que ha captado en las convocatorias competitivas nacionales y regionales 1,8 millones de euros. De esta suma, 1,4 millones corresponden a la financiación obtenida para proyectos de I+D desde 2008. Calcula que si agrega los proyectos dirigidos por otros miembros del equipo se superan los dos millones de euros.

Para comprender la excepcionalidad de esta suma solo hay que tener en cuenta que si los 297 grupos científicos de la Universidad de Málaga hubieran tenido resultados similares en este periodo, habrían logrado 594 millones para I+D.

La catedrática, por si alguien alberga dudas, subraya que estos fondos se destinan a "contratos a técnicos, congresos, becarios, equipamiento, revisión y edición de publicaciones", así como a costes indirectos que se quedan en las arcas de la UMA.

Los diferentes miembros de Lexytrad dirigen en la actualidad seis proyectos de investigación (tres europeos, dos nacionales y uno de la Junta de Andalucía), entre los que figuran Termitur, un diccionario inteligente terminológico inglés/español/alemán especializado en el sector turístico, que ha sido ideado para "favorecer el desarrollo económico, facilitar el intercambio comercial y mejorar el sector turístico español y andaluz en relación con países europeos y del resto del mundo en un contexto cada vez más globalizado ". Esta iniciativa se desarrolla en colaboración con la empresa granadina Intelligenia Soluciones Informáticas.

Además, el Ministerio de Economía, en la resolución del programa de fomento de la investigación científico técnica de excelencia, ha comprometido un presupuesto de 55.000 euros para otra investigación liderada por Gloria Corpas que propone, por primera vez, introducir las tecnologías de la información y las comunicaciones en la interpretación.

Mientras internet y las TIC han transformado la actividad del traductor, el intérprete sigue trabajando en su cabina como lo hacía hace 50 años. "La interpretación es una actividad ardua y extremadamente estresante, que requiere un gran esfuerzo para descodificar, memorizar y recodificar el mensaje", explica Gloria Corpas para poner de relieve que ese sacrificio se tenga que hacer sin apenas apoyo de herramientas tecnológicas. El proyecto, titulado VIP: sistema integrado voz-texto para intérpretes, plantea identificar las necesidades de estos profesionales y el grado de automatización que admiten y analizar las tecnologías que existen para crear un sistema integrado que se pueda utilizar tanto durante la interpretación, como antes y después.

No hay comentarios

Ver los Comentarios

También te puede interesar

Lo último