En el mundo actual de la inteligencia artificial aplicada al desarrollo de software, las herramientas que utilizan modelos avanzados para asistir en la creación y mantenimiento de código son cada vez más comunes. Cursor es una de esas plataformas que ha integrando varios modelos de lenguaje con personalidades específicas para resolver distintos tipos de tareas dentro del proceso de programación. En el último mes, se registraron más de 4000 llamadas de agentes en Cursor, ofreciendo una oportunidad única para analizar cómo cada modelo se desempeña, la personalidad que proyecta y las mejores formas de aprovecharlos según el contexto del proyecto. Uno de los aspectos más destacados es que cada modelo tiene características particulares que podrían definirse como su “personalidad”. Esta característica afecta el ritmo de trabajo, la calidad del código generado, la gestión del proyecto y la capacidad de respuesta ante problemas complejos.
Por ejemplo, está el modelo “o3” de OpenAI, llamado coloquialmente el arquitecto perezoso, cuya fortaleza reside en la planificación y el análisis exhaustivo. Es capaz de leer decenas de archivos y entender el panorama general del proyecto, aunque se muestra reticente o incapaz de gestionar tareas que impliquen editar múltiples archivos simultáneamente. Es ideal para escenarios donde el desarrollo se limita a uno o dos archivos y se requiere un foco fuerte en el diseño. En contraste, el modelo “Claude Sonnet 3.7 Thinking”, conocido entre los usuarios como el niño entusiasta, se caracteriza por su energía y disposición para abordar tareas desde el primer momento, aunque esa premura puede derivar en descuidos.
A menudo, en cadenas largas de comandos, puede perder el foco e implementar cambios no relacionados con lo solicitado inicialmente. Este modelo es especialmente útil cuando se trabaja en áreas pequeñas con un plan muy ajustado o cuando se necesita ejecutar múltiples cambios simples en diferentes partes del código, siempre bajo supervisión cuidadosa para evitar errores. Entre estos dos extremos, Gemini 2.5 Pro representa un equilibrio interesante en términos de inteligencia y velocidad. Se muestra más reservado y metódico que Sonnet 3.
7 y es el modelo recomendado para escribir código que involucra múltiples archivos y requiere coordinación precisa. La combinación de dominio técnico y rapidez lo coloca como una herramienta fiable para manejar proyectos de complejidad media, donde es indispensable mantener la calidad y coherencia sin sacrificar productividad. Por otro lado, se observa que el modelo o4-mini es lento y su desempeño resulta mediocre comparado con sus pares, lo que limita su uso a tareas muy específicas o restringidas. GPT 4.1, aunque potente en teoría, es mejor aprovecharlo en contextos muy determinados, como generar fórmulas o realizar tareas donde se necesita una precisión extrema en segmentos pequeños dentro del código.
La experiencia de quienes utilizan estos modelos sugiere algunas buenas prácticas para optimizar la colaboración con cada IA. En el caso de proyectos con complejidad media que involucren la edición de un solo archivo, la elección lógica es o3, para sacar provecho de su capacidad analítica y de planificación. Si el trabajo abarca múltiples archivos, una estrategia recomendada es planificar con o3 y desarrollar el código con Gemini 2.5, aprovechando sus fortalezas complementarias. Para tareas más simples que exigen editar numerosos archivos, el esquema cambia.
Aquí, o3 puede usarse para la planificación, pero al momento de escribir, Claude Sonnet 3.7 es el más apropiado, por su agilidad en tareas repetitivas y sencillas, manteniendo la supervisión para evitar desviaciones. En situaciones que requieren aplicar fórmulas o procesos muy claros y repetitivos, GPT 4.1 puede tomar el protagonismo mediante prompts detallados. En escenarios de alta complejidad, lo recomendable es un enfoque estratégico y fragmentado.
Esto implica planificar con o3, dividir el proyecto en partes manejables y luego escribir código en segmentos pequeños con Gemini 2.5, con una atención meticulosa a cada sección para mitigar posibles errores. Aunque algunos usuarios admiten usar un método de “YOLO” (hacer todo rápido sin tanto cuidado) y corregir después, esta práctica aumenta la posibilidad de problemas en el futuro. Las comunidades que utilizan Cursor también destacan cuestiones interesantes sobre los modelos en aspectos técnicos y económicos. Por ejemplo, Gemini 2.
5 Pro es valorado por la calidad del código, pero a veces se detiene inesperadamente y requiere estímulos o nuevos comandos para continuar. La diferencia entre versiones “Pro” y “Pro Max” o entre “Sonnet 3.7” y “3.7 Max” se relaciona con la cantidad de contexto que manejan y el costo asociado a las llamadas o herramientas, que puede ser un factor importante en proyectos grandes. Asimismo, algunos usuarios han expresado la necesidad de que la plataforma integre controles para evitar que ciertos agentes ejecuten procesos infinito o indeseados, como vigilancia constante de tests, para reducir gastos y mejorar la eficiencia automática del ciclo de desarrollo.
Es interesante mencionar que versiones anteriores o alternativas como Sonnet 3.5 tienen una personalidad diferente: menos hábiles pero con un enfoque más relajado que puede ser útil en tareas donde no necesariamente se requiere la máxima precisión o análisis exhaustivo. Deepseek es otro modelo que, aunque menos apreciado, ofrece ventajas para usuarios que prefieren alternativas a o3, aunque también presenta cierto nivel de imprevisibilidad. Los perfiles de usuario coinciden en que la elección del modelo debe ajustarse a la naturaleza del proyecto, el nivel de complejidad, el tamaño del código a intervenir y el estilo de trabajo del equipo. No hay un modelo único que resuelva todo con excelencia, sino que la combinación y la aplicación inteligente de cada uno permiten alcanzar mejores resultados en términos de calidad, velocidad y economía.
En resumen, la exploración de más de 4000 llamadas a agentes en Cursor brinda una visión clara de cómo las personalidades atribuidas a diversos modelos de inteligencia artificial impactan en el desarrollo de software. Entender las fortalezas y limitaciones de cada opción permite a los desarrolladores optimizar sus flujos de trabajo, distribuir tareas de manera eficiente y mantener un control adecuado sobre la calidad del producto final. A medida que la tecnología mejora y las plataformas evolucionan, es muy probable que estos modelos continúen especializándose y adaptándose para convertirse en asistentes aún más valiosos dentro del ecosistema de la programación moderna.