En el mundo actual, donde el manejo y análisis de datos son fundamentales para el éxito de las empresas, la eficiencia en el desarrollo y mantenimiento de pipelines y modelos de datos es esencial. Nao Labs, una startup emergente apoyada por Y Combinator en su cohort X25, ha lanzado una herramienta innovadora llamada nao, que ha sido diseñada específicamente como un editor de código potenciado por inteligencia artificial (IA) para trabajar con datos. Este lanzamiento ha captado la atención de la comunidad tecnológica, en especial entre los profesionales que buscan herramientas más inteligentes y adaptadas a sus flujos de trabajo diarios de datos. Nao busca ofrecer algo más que un simple asistente de autocompletado para SQL o Python. A diferencia de herramientas existentes como Cursor, que completan consultas SQL sin entender profundamente la estructura y contexto de los datos, nao se conecta nativamente a los almacenes de datos, como BigQuery, Snowflake y Postgres, ofreciendo un copiloto de IA que tiene un conocimiento incorporado del esquema de datos y de las herramientas específicas del entorno.
Esto permite no solo escribir código relevante y preciso, sino también visualizar y analizar el impacto directo del código en los resultados de los datos. La importancia de una conexión nativa con los almacenes de datos no puede subestimarse. En entornos corporativos, los analistas y los ingenieros de datos a menudo dependen de múltiples herramientas desconectadas: un editor para escribir consultas, una consola para examinar resultados, una herramienta de observabilidad para diagnosticar problemas y un software de inteligencia empresarial para monitorear dashboards. Esta fragmentación ralentiza los procesos y genera riesgos, especialmente cuando una pequeña modificación en el código puede provocar errores significativos en reportes críticos para la dirección. El enfoque de nao es ofrecer una experiencia integrada que reduzca este riesgo y acelere el ciclo de desarrollo de datos.
La interfaz, basada en un fork de VS Code, incluye conectores preinstalados para los principales almacenes de datos y un sistema de pestañas y agentes alimentados por IA que trabajan con rankings de recuperación (RAG) propios para recuperar rápidamente el contexto relevante tanto del esquema como del código. Esta combinación permite que el copiloto genere código SQL, Python o YAML que se alinea perfectamente con el esquema de datos del usuario. Una de las características más destacadas de nao es la visualización lado a lado del código y la diferencia en los datos resultantes tras ejecutar una consulta o modificar un pipeline. Esta función facilita que los equipos puedan comprender el impacto de cualquier cambio rápidamente, permitiendo detectar anomalías como valores duplicados, valores faltantes, outliers o incluso prever rupturas en dependencias y lineage data. En esencia, nao incorpora dentro del editor controles de calidad que normalmente requieren herramientas externas o procesos manuales.
Para los equipos de datos, especialmente aquellos que utilizan dbt para construir modelos y transformaciones en SQL, nao ofrece un entorno colaborativo donde crear, documentar y validar modelos se vuelve más intuitivo y confiable. Sus capacidades para probar y detectar impactos en toda la cadena de datos aseguran que los dashboards que consumen dichas datasets no presenten fallos o números erróneos. Además, para perfiles menos técnicos, el copiloto representa una guía que fortalece las mejores prácticas en código, facilitando la participación de miembros diversos dentro de un equipo de datos grandes. Los ingenieros de software también encuentran en nao una herramienta valiosa para explorar bases de datos, escribir consultas SQL complejas o trabajar con definiciones de datos (DDL). Su integración con el esquema y la capacidad de inferir relaciones entre tablas incluso cuando no existen claves foráneas explícitas hace que la creación y mantenimiento de consultas sea más eficiente y menos propenso a errores.
En cuanto a la comparación con otras herramientas similares, como Cursor y los Módulos de Código de Producto (MCPs), nao destaca por mantener siempre disponible el contexto completo del almacén de datos en un RAG. Mientras que Cursor depende de múltiples llamadas para conseguir contexto durante el autocompletado, nao lo tiene incorporado de forma instantánea, lo que mejora la relevancia de las sugerencias y reduce la fragmentación en la experiencia del usuario. Al estar preconfigurado y empaquetado para equipos de datos, nao elimina la carga de configurar extensiones, autenticaciones o pipelines de CI/CD complejas. La privacidad y seguridad son también aspectos cruciales en el diseño de nao. El contenido real de los datos nunca sale del entorno local del usuario sin consentimiento explícito.
Solo se envían embeddings del esquema y el código para alimentar los modelos de IA, garantizando que los datos sensibles permanezcan protegidos. Para organizaciones con exigencias más estrictas, la versión empresarial ofrece opciones para que los datos no transiten por endpoints públicos de IA, alineándose con normativas y políticas internas. El desarrollo de propios modelos de IA entrenados específicamente para SQL, Python y YAML, con un enfoque dedicado al contexto de los datos, es otro diferenciador clave de nao. La precisión en la escritura y la capacidad de ofrecer sugerencias útiles y contextuales mejora considerablemente la productividad y reduce los errores humanos, un beneficio particularmente valioso cuando se manejan datos económicos o cálculos complejos que impactan decisiones corporativas. Nao Labs también está comprometida con la expansión y adaptación continua del editor.
Próximamente se sumarán más conectores para soportar otros data warehouses populares, incluyendo SQLite, DuckDB, SQL Server, Databricks e Iceberg, respondiendo así a las demandas de la comunidad y permitiendo que el editor sea verdaderamente agnóstico respecto a la infraestructura de datos. Desde su lanzamiento, nao ha recibido comentarios muy positivos de usuarios en distintos sectores, quienes valoran especialmente la reducción en sus tiempos de desarrollo y el aumento en la confianza sobre la calidad de sus datos. La inclusión de funciones para análisis exploratorio mediante chat con el copiloto facilita preguntas directas sobre columnas o datasets, democratizando el acceso a insights incluso para perfiles no técnicos. En definitiva, la propuesta de valor de nao radica en transformar la experiencia tradicional de trabajar con datos, convirtiendo un proceso fragmentado, propenso a errores y lento, en una actividad integrada, ágil y precisa gracias al poder de la inteligencia artificial y la profunda comprensión del contexto del dato. Para organizaciones que necesitan acelerar su transformación digital y maximizar el valor de sus activos de datos, esta herramienta ofrece una plataforma moderna que une código, contexto y calidad en un solo lugar.
Para quienes deseen probar nao, la startup ofrece una versión gratuita para Mac, con planes de extender su soporte a Linux y Windows. Además, permite crear cuentas temporales sin necesidad de correo electrónico, facilitando la evaluación rápida y sin barreras técnicas. Los fundadores, Claire y Christophe, están abiertos a recibir retroalimentación de la comunidad para mejorar y evolucionar la herramienta según las necesidades reales de los equipos que trabajan con datos diariamente. La llegada de nao representa un avance significativo en el ecosistema de herramientas para datos, especialmente en un momento en que el uso de modelos de lenguaje grande se convierte en la norma para desarrolladores, pero aún no se había traducido plenamente en el contexto específico y complejo del trabajo con datos. Combinando la experiencia técnica de sus fundadores con una visión clara de los desafíos de los equipos de datos, nao avanza hacia convertirse en el espacio predilecto para que profesionales de datos puedan programar, analizar y validar sus pipelines y modelos con un nivel de confianza y eficiencia nunca antes alcanzado.
En resumen, Nao Labs está redefiniendo cómo los profesionales trabajan con datos, ofreciendo un editor de código con inteligencia artificial que aporta contexto, control de calidad y una experiencia integrada que acelera el desarrollo y asegura la integridad de los datos. A medida que la herramienta evolucione y amplíe su compatibilidad con más plataformas, promete convertirse en un elemento esencial para cualquier equipo que busque exprimir al máximo el valor de sus datos mientras mantienen altos estándares de calidad y velocidad operativa.