La traducción automática ha experimentado un desarrollo notable en las últimas décadas, y con el auge de la inteligencia artificial y los grandes modelos de lenguaje, se ha abierto una nueva era en la forma en que los idiomas se entrelazan cultural y emocionalmente. Este fenómeno es particularmente relevante en el contexto de los idiomas indicios, que poseen una riqueza semántica, histórica y emotiva difícil de capturar mediante herramientas digitales. Los avances en inteligencia artificial han mejorado sustancialmente la traducción entre idiomas como el sánscrito, el hindi y el telugu hacia el inglés, aunque preservar el sentimiento y la profundidad cultural sigue siendo uno de los principales desafíos que enfrentan los desarrolladores y lingüistas. Un reciente estudio realizado por investigadores del Transitional Artificial Intelligence Research Group en la Universidad de Nueva Gales del Sur (UNSW Sydney) y el Centre for Artificial Intelligence and Innovation en el Pingla Institute de Sydney, evaluó el desempeño de varios grandes modelos de lenguaje (LLMs) en la traducción de textos complejos y cargados emocionalmente. El análisis incluyó modelos líderes como GPT-3.
5, GPT-4o de OpenAI, Google Gemini y Google Translate, centrándose en la traducción de tres obras fundamentales con diferentes géneros y épocas: la Bhagavad Gita, una pieza central de la espiritualidad y filosofía hindú; Maha Prasthanam, una antología poética; y Tamas, una novela contemporánea. Estas obras no solo presentan un reto semántico, sino que también exigen la conservación de matices sentimentales profundos que forman parte integral del significado original. Para ello, los expertos emplearon traducciones humanas de alta calidad como referencia, comparándolas con las producidas por los modelos mediante análisis semánticos y de sentimiento. Mientras que el análisis semántico valora la exactitud en la transmisión del sentido, el análisis de sentimiento se enfoca en cómo las emociones y tonalidades anímicas son preservadas o alteradas en la traducción. Los resultados demostraron que aunque los modelos de inteligencia artificial han avanzado enormemente en precisión, conservar la integridad sentimental y semántica de textos con contenido filosófico, poético o culturalmente cargado todavía representa un enorme desafío.
Los LLM lograron captar tendencias amplias y generales en cuanto a las emociones presentes, pero se observaron sesgos específicos de cada modelo en la interpretación del sentimiento. Este aspecto dificulta que la traducción transmita fielmente la experiencia emocional original, especialmente en contextos donde el lenguaje figurado o los símbolos culturales son predominantes. Uno de los hallazgos más destacados fue la superioridad de GPT-4o en mantener una correlación cercana a la interpretación humana en cuanto a la distribución del sentimiento. Esto implica que su comprensión de las emociones subyacentes al texto es más matizada y consistente, posicionándolo como la herramienta más fiable y estable en comparación con Gemini y Google Translate. Este último presentó fluctuaciones notables en el tono emocional, oscilando entre un optimismo excesivo y un pesimismo marcado, lo que levanta dudas sobre su confiabilidad en textos emocionalmente sensibles.
En el campo del alineamiento semántico, GPT-4o también sobresalió en la preservación del significado y la estructura de las oraciones en textos en sánscrito e hindi, mientras que Gemini mostró un desempeño más destacado en la traducción de poemas en telugu, capturando mejor el ritmo y la riqueza figurativa inherentes al género. Por otra parte, Google Translate tendió a ofrecer traducciones más literales pero menos adaptadas al contexto y la complejidad de los textos, evidenciando dificultades especialmente en obras antiguas o con lenguaje metafórico. Estos resultados subrayan la importancia de no solo depender de la literalidad, sino de comprender el contexto cultural, histórico y emocional que da vida y profundidad al texto. A pesar del notable progreso de los LLM, las traducciones humanas siguen siendo insustituibles en cuanto a la preservación de la esencia poética y contextual que muchos textos clásicos representan. El estudio también identificó que los modelos enfrentan problemas específicos en la interpretación de contenidos abstractos y filosóficos, donde la ambigüedad y la metáfora son elementos clave.
Las expresiones emocionales complejas y los matices propios de las tradiciones culturales intensifican la dificultad, llevando a los modelos a parafrasear en lugar de traducir directamente, lo que puede diluir el impacto original del mensaje. Además, las particularidades del idioma indicio, como el uso de honoríficos y expresiones formales, se tradujeron de modo inconsistente, afectando la precisión y la sensibilidad cultural. Estos aspectos reflejan la necesidad de sistemas más adaptados culturalmente, que puedan integrar no solo la estructura lingüística sino también el conocimiento contextual del material de origen. Una propuesta relevante surgida del análisis sugiere que proporcionar indicaciones contextuales adicionales a los modelos podría mejorar sustancialmente la calidad de la traducción, especialmente en lo que respecta a la alineación emocional con el texto original. De esta forma, se busca reducir los sesgos propios de cada modelo en la interpretación del sentimiento y enriquecer la fidelidad cultural de las traducciones.