En la era digital actual, la información es más accesible que nunca, pero también más abundante y a menudo descontrolada. La capacidad de obtener respuestas rápidas y confiables a partir de grandes volúmenes de datos es fundamental para investigadores, profesionales y usuarios curiosos por igual. En este contexto, VerifAI surge como una innovadora plataforma de búsqueda generativa de código abierto que no solo proporciona respuestas, sino que además verifica su precisión y fiabilidad, algo que puede cambiar por completo la forma en que interactuamos con la información. VerifAI se presenta como un motor de búsqueda generativa orientado a la obtención de respuestas verificables basadas en documentos, una solución pionera que aborda uno de los desafíos más grandes en la inteligencia artificial moderna: la generación de respuestas creativas sin basamento real, conocidas como "alucinaciones" en modelos de lenguaje grandes. Estos modelos generativos, pese a su enorme capacidad para comprender y producir lenguaje natural, a menudo fabrican información inexistente o incorrecta, un problema que VerifAI combate mediante un sistema de verificación auxiliar incorporado dentro de su arquitectura.
El núcleo tecnológico de VerifAI combina técnicas avanzadas de búsqueda tanto léxica como semántica para extraer los documentos y fragmentos más relevantes de grandes colecciones de datos. Estos pueden ser archivos en formatos variados, como PDF, TXT, DOCX, PPTX o Markdown, ampliando su versatilidad para adaptarse a múltiples contextos y necesidades. Posteriormente, el sistema utiliza modelos de lenguaje generativo, compatibles con estándares de OpenAI API y ejecutables con motores como vLLM, Nvidia NIM u Ollama, para construir una respuesta coherente y fundamentada. Lo que realmente distingue a VerifAI es su módulo de verificación. Comprueba las fuentes originales que sustentan cada afirmación generada, utilizando un modelo específico ajustado para detectar inexactitudes, interpretaciones erróneas y posibles suposiciones incorrectas.
Este proceso asegura que las respuestas no solo sean informativas y relevantes, sino también confiables y verificables, reduciendo considerablemente el riesgo de desinformación. La integración de esta función es primordial en campos donde la precisión es crítica, como el biomédico, jurídico o académico. Aunque inicialmente VerifAI se enfocó en el sector biomédico debido a la alta demanda de información veraz en medicina y ciencias de la salud, su diseño flexible y escalable permite ahora su uso en cualquier área que requiera gestionar grandes bases de datos para extraer conocimiento con garantías de autenticidad. Además, su naturaleza de código abierto permite que cualquier usuario pueda instalar, adaptar y mejorar la plataforma según sus necesidades específicas. La facilidad de instalación y uso es otro pilar de VerifAI.
Con un único script, los usuarios pueden configurar el entorno completo que incluye componentes esenciales como OpenSearch, Qdrant y PostgreSQL, sin necesidad de una preparación extensa. Esta simplicidad facilita la adopción por parte de organizaciones, instituciones educativas y desarrolladores individuales interesados en explorar o implementar soluciones avanzadas de pregunta y respuesta. Además, la plataforma soporta la indexación de volúmenes masivos de documentos; se ha probado con más de 200 GB de datos y 30 millones de documentos, evidenciando su robustez y capacidad para escalar según los requerimientos. La combinación de búsqueda léxica y semántica mejora la precisión en la recuperación, asegurando que las respuestas estén construidas con base en las fuentes más pertinentes. VerifAI también ofrece una interfaz amigable desarrollada con React.
js que incluye funcionalidades modernas como registro y acceso de usuarios, y próximamente soporte para inicio de sesión único a través de servicios populares como AzureAD, Google o GitHub. Esta atención al detalle en la experiencia del usuario demuestra el compromiso por hacer la tecnología accesible y eficiente. En el campo biomédico, VerifAI ha desarrollado una versión especializada que integra conjuntos de datos reconocidos, como Medline, que facilitan la búsqueda de información validada y actualizada en medicina. El proceso de transformación y preparación de los datos en esta versión emplea diversas herramientas y scripts dedicados que garantizan la calidad y compatibilidad con la plataforma. El impacto de VerifAI en la investigación y desarrollo de inteligencia artificial es notable, habiendo sido apoyado por el proyecto NGI Search de la Unión Europea y contando con múltiples publicaciones académicas que avalan su innovación y contribución al conocimiento científico en sistemas de pregunta-respuesta y verificación.
Este proyecto es liderado por instituciones como Bayer A.G. y el Instituto de Investigación y Desarrollo en Inteligencia Artificial de Serbia, combinando experiencia industrial y académica para avanzar en soluciones que combaten el problema de la desinformación generada por IA. La comunidad abierta invita a contribuciones, fomentando un ecosistema participativo que potencia el crecimiento y mejora continua del software. La importancia de herramientas como VerifAI radica en la creciente dependencia de tecnologías generativas para la búsqueda y procesamiento de información en diversos sectores.