En los últimos años, la inteligencia artificial ha evolucionado a pasos agigantados, y uno de sus avances más fascinantes ha sido el desarrollo de los modelos de lenguaje grandes o LLM por sus siglas en inglés. Estos modelos, capaces de comprender y generar texto con una precisión sorprendente, se han convertido en herramientas fundamentales en áreas tan diversas como la atención al cliente, la generación de contenido y el análisis de datos. Sin embargo, más allá de su utilidad profesional, también están sirviendo como base para experiencias lúdicas e interactivas que invitan a usuarios de todo tipo a explorar el pensamiento artificial. Entre estos proyectos destaca una propuesta innovadora llamada "We Asked 10 LLMs", un juego diario que reta a los participantes a adivinar las respuestas más comunes que dieron diez modelos de lenguaje diferentes frente a una misma pregunta. Este concepto pone en el centro la curiosidad sobre cómo piensan las máquinas y genera a la vez un componente social y competitivo que lo hace aún más atractivo.
El fundamento de We Asked 10 LLMs está inspirado en juegos clásicos como Family Feud, donde los jugadores deben descubrir las respuestas más populares dadas por un grupo. La diferencia es que en esta propuesta las respuestas provienen no de un grupo de personas, sino de diversas inteligencias artificiales. Cada día, el juego presenta una nueva pregunta o desafío para el que los modelos de lenguaje generan múltiples respuestas. A partir de esas respuestas, se establecen cuáles son las más comunes y representativas. Los usuarios entonces intentan adivinar esas respuestas para acumular puntos y avanzar en el juego.
Una de las características que hacen único a We Asked 10 LLMs es la diversidad de modelos involucrados. En lugar de limitarse a una sola IA, el juego integra hasta diez modelos sofisticados, entre ellos GPT-3.5 Turbo, Llama-3 70B, Mixtral 8x7B y otros destacados en la industria. Esto no solo enriquece la variedad de respuestas, sino que también ofrece una perspectiva comparativa sobre cómo diferentes sistemas interpretan la misma consulta. La comparación entre modelos permite identificar patrones, sesgos o singularidades en su procesamiento del lenguaje natural.
El sistema de generación de preguntas y respuestas funciona mediante un proceso automatizado que se ejecuta semanalmente. Este proceso selecciona temas variados de manera aleatoria y consulta a los diferentes LLMs para que respondan. Posteriormente, se realiza un análisis que agrupa las respuestas similares, gracias a la consolidación semántica que ayuda a identificar variaciones de una misma idea, como por ejemplo diferentes formas de nombrar a una persona famosa. Luego, se asignan puntos a las respuestas en función de su popularidad y frecuencia entre los modelos, sumando un total de 100 puntos por pregunta. Desde la experiencia del usuario, el juego es sencillo pero desafiante.
Cada jugador dispone de un número limitado de intentos para adivinar las respuestas correctas. Al acertar, las respuestas se revelan en el tablero y se otorgan los puntos correspondientes. El objetivo es completar todas las respuestas o utilizar todos los intentos disponibles. El sistema guarda el progreso automáticamente y permite compartir los resultados a través de redes sociales, promoviendo un componente social que incentiva la competencia amistosa y la difusión del juego. La interfaz de We Asked 10 LLMs está desarrollada con tecnologías modernas que garantizan una experiencia fluida y responsiva.
En el frontend, se emplea React 18 con TypeScript, lo que permite una navegación ágil y un diseño intuitivo. En el backend, se utiliza Node.js con Express y MongoDB para administrar el almacenamiento de preguntas y las respuestas de los modelos, además de facilitar la generación automática de puzzles mediante tareas programadas. La integración de APIs de LLMs se realiza a través de Langchain y TogetherAI, herramientas que permiten la comunicación simultánea con múltiples modelos. El proyecto no solo destaca por su innovación tecnológica, sino también por su enfoque en la comunidad y el código abierto.
Está disponible públicamente para que desarrolladores interesados puedan revisarlo, contribuir y adaptarlo. Este enfoque colaborativo incentiva la mejora continua y la experimentación con nuevas funcionalidades o modelos de lenguaje que puedan incorporarse en el futuro. El juego también refleja una tendencia creciente en la forma en que los humanos interactúan con las inteligencias artificiales. En lugar de simplemente usar estas tecnologías como herramientas pasivas, iniciativas como We Asked 10 LLMs fomentan una relación más dinámica y lúdica, donde la curiosidad y la creatividad humana se combinan con la capacidad analítica de las máquinas. De esta manera, se abre un nuevo espacio para la educación, el entretenimiento y la reflexión sobre el impacto de la IA en nuestra vida cotidiana.
Además, al comparar las respuestas de múltiples modelos, el juego brinda una ventana única para entender cómo las inteligencias artificiales interpretan el lenguaje, qué tipo de respuestas consideran más relevantes y cómo varían sus perspectivas. Esto es especialmente valioso para investigadores y entusiastas que desean profundizar en las diferencias entre arquitecturas y datos de entrenamiento. En términos de accesibilidad, We Asked 10 LLMs está diseñado para ser usado tanto por expertos en tecnología como por públicos generales sin conocimientos avanzados de IA. Su interfaz amigable y reglas claras permiten que cualquier persona pueda disfrutar del juego y, al mismo tiempo, aprender algo nuevo sobre el funcionamiento y el pensamiento artificial. La posibilidad de revisar respuestas de días anteriores también enriquece la experiencia y ayuda a mejorar la estrategia de los jugadores.