Realidad Virtual

Extensión de Postgres para soportar RAG de extremo a extremo: Revolucionando la gestión de datos y recuperación inteligente

Realidad Virtual
Postgres extension to support end-to-end RAG

Explora cómo la extensión experimental de Postgres está transformando los procesos de Recuperación Aumentada por Generación (RAG) al integrar extracción, segmentación, generación y reordenamiento de texto, combinando modelos locales y remotos para ofrecer soluciones inteligentes y eficientes en bases de datos.

La gestión y recuperación de información en bases de datos ha evolucionado considerablemente en los últimos años, especialmente con la integración de tecnologías avanzadas de inteligencia artificial y aprendizaje automático. En este contexto, la extensión experimental de Postgres destinada a soportar procesos completos de Recuperación Aumentada por Generación, conocida como RAG, emerge como una herramienta innovadora que combina extracción, procesamiento y generación de texto para optimizar la manera en que se manejan grandes volúmenes de datos textuales. Postgres, reconocido por su robustez y flexibilidad como sistema de gestión de bases de datos relacional, amplía sus capacidades mediante esta extensión que facilita la creación de pipelines de RAG de extremo a extremo. Esta tecnología permite no solo almacenar y consultar datos, sino también integrar funcionalidades inteligentes que involucran la extracción de texto, la segmentación en fragmentos procesables, la generación de representaciones vectoriales (embeddings) y el reordenamiento de información relevante para responder consultas complejas. Uno de los aspectos fundamentales de esta extensión es su capacidad para extraer texto desde diversos formatos de archivo, ofreciendo soporte inicial para documentos PDF y archivos .

docx, además de la conversión de HTML a Markdown. Aunque actualmente no incluye soporte para OCR ni procesamiento de disposiciones complejas, la extracción nativa se realiza eficazmente utilizando bibliotecas especializadas como pdf-extract y docx-rs, lo que facilita la incorporación de contenido no estructurado dentro del propio entorno de la base de datos. El siguiente paso tras la extracción es la segmentación o chunking del texto para generar fragmentos manejables. Esta técnica es crucial para procesar información en modelos de inteligencia artificial, ya que divide textos largos en trozos con límite en cantidad de caracteres o tokens, además de permitir solapamientos entre fragmentos para preservar el contexto durante el procesamiento. La extensión ofrece métodos de chunking tanto por conteo de caracteres como por conteo de tokens, siendo este último más preciso para modelos que operan con secuencias de tokens en lugar de caracteres simples.

El corazón del sistema RAG basado en Postgres son las capacidades de creación y manipulación de embeddings y la reordenación (reranking) de resultados. La extensión proporciona modelos locales que se ejecutan directamente en el servidor de base de datos, ya sea en CPU o GPU, utilizando modelos compactos con aproximadamente 33 millones de parámetros. Estos modelos permiten tokenizar el texto, generar embeddings y calcular puntuaciones de relevancia para fragmentos de texto de manera eficiente, sin depender totalmente de servicios externos, lo que reduce latencias y protege la privacidad. Para expandir aún más las posibilidades, la extensión también integra llamadas a modelos remotos disponibles vía APIs REST sobre HTTPS. Esto incluye el acceso a modelos avanzados de OpenAI, Anthropic, Fireworks.

ai y Voyage AI para generación de embeddings y respuestas mediante chat. Así, es posible combinar la capacidad local con el poder de modelos más grandes y sofisticados alojados en la nube, logrando un balance entre rapidez, coste y precisión según el caso de uso. La integración de todas estas funcionalidades dentro de Postgres agiliza la creación de pipelines complejos en las que se almacenan documentos, se extrae y segmenta la información, se generan representaciones vectoriales, y finalmente, se realiza la consulta y generación de respuestas basadas en el contexto más relevante. Por medio de SQL y funciones nativas, los desarrolladores pueden implementar flujos de procesamiento inteligentes sin salir del entorno de base de datos, lo que simplifica considerablemente la infraestructura y optimiza la eficiencia. Uno de los puntos destacados es el diseño del sistema para manejar múltiples procesos y evitar el consumo desmedido de memoria en tareas de reranking o embedding.

Esto se consigue mediante un proceso o trabajador en segundo plano multihilo que se inicia con el lanzamiento de Postgres y carga los modelos bajo demanda. Esta arquitectura asegura estabilidad y escalabilidad en entornos empresariales donde la simultaneidad y el rendimiento son críticos. La documentación recomienda la instalación previa de pgvector, una extensión que añade soporte para vectores y operaciones de similitud, base para trabajar con embeddings en Postgres. Luego, la compilación y configuración de la extensión experimental requiere el uso de Rust y pgrx, una herramienta especializada para desarrollo de extensiones Postgres en Rust. Se destaca la compatibilidad actual con sistemas Linux y macOS, mientras que el soporte para Windows aún no está desarrollado.

En cuanto a la generación y uso de modelos, la extensión ofrece la posibilidad de incluir modelos .onnx de forma embebida en las extensiones o descargarlos de un repositorio controlado bajo demanda al momento del primer uso. Esto permite una mayor flexibilidad, especialmente en ambientes donde los recursos o políticas de red restringen la incorporación de modelos pesados. El uso práctico se ve reflejado en ejemplos donde documentos PDF son convertidos a texto dentro de la base de datos, segmentados y almacenados junto con sus embeddings. Al consultar, un texto de pregunta se convierte en embedding y se busca la mayor similitud en los fragmentos de texto almacenados, seguidamente se aplica reranking para seleccionar los fragmentos más relevantes.

Finalmente, se puede enviar esta información a un modelo de chat remoto para generar respuestas precisas y contextuales, conformando un pipeline RAG completo. El impacto de esta extensión es considerable para sectores que manejan grandes cantidades de textos, como legal, financiero, académico o de atención al cliente. La posibilidad de consultar información de manera semántica e integrada directamente en el motor de base de datos abre vías para construir aplicaciones inteligentes, sistemas de consulta avanzados y asistentes virtuales altamente especializados. Además, la licencia Apache 2.0 que cubre el proyecto permite la adopción y adaptación libre para desarrollos comerciales y comunitarios, facilitando la colaboración y el avance tecnológico en el ámbito de bases de datos inteligentes.

Trading automático en las bolsas de criptomonedas Compra y vende tu criptomoneda al mejor precio

Siguiente paso
The GeoGuessr StreetView meta-game
el miércoles 14 de mayo de 2025 El Meta-Juego de GeoGuessr: Dominando el Mundo a Través de StreetView

Explora el fascinante meta-juego de GeoGuessr, donde la comprensión profunda de las imágenes de StreetView, las variaciones geográficas y las actualizaciones de mapas juegan un papel crucial para los jugadores competitivos que buscan superar desafíos globales.

Top Colleges Are Too Costly Even for Parents Making $300k
el miércoles 14 de mayo de 2025 El Alto Costo de las Universidades Elite Afecta Incluso a Familias con Ingresos de $300,000 al Año

El aumento constante en el costo de las universidades selectivas está generando una carga financiera significativa para las familias de clase media alta, que muchas veces ganan lo suficiente para no calificar para ayudas, pero no tienen la capacidad de cubrir los costos sin endeudarse.

npkhang99/bitcoin-ewallet-thesis
el miércoles 14 de mayo de 2025 Construyendo una Billetera Electrónica Experimental para Bitcoin: Innovación y Aprendizaje en el Mundo Cripto

Explora el desarrollo de una billetera electrónica para Bitcoin construida desde cero, enfocada en la comprensión profunda de la criptomoneda, con una estructura HD simplificada y funcionalidades clave que permiten la gestión eficiente de transacciones en la red Bitcoin.

This Is When Altcoin Season Will Start, According To BitMEX Founder Arthur Hayes
el miércoles 14 de mayo de 2025 Cuándo Comenzará la Temporada de Altcoins Según Arthur Hayes, Fundador de BitMEX

Explora las predicciones del fundador de BitMEX, Arthur Hayes, sobre el inicio de la temporada de altcoins, el impacto del precio de Bitcoin y qué proyectos altcoins tienen el mayor potencial de crecimiento basado en ingresos sostenibles y distribución de beneficios.

Reproducibility project fails to validate dozens of biomedical studies
el miércoles 14 de mayo de 2025 La crisis de la reproducibilidad en la ciencia biomédica: hallazgos del proyecto brasileño que sacude la investigación

Un ambicioso estudio en Brasil revela que menos de la mitad de los experimentos biomédicos pueden ser replicados con éxito, poniendo en evidencia la urgente necesidad de reformar las prácticas científicas y fortalecer la confiabilidad de la investigación en el país.

GameFi Tokens Show Signs of Life After Gala Games, White House Tie-Up
el miércoles 14 de mayo de 2025 El Renacer de los Tokens GameFi Tras la Colaboración de Gala Games con la Casa Blanca

El sector GameFi muestra señales de recuperación significativa después de la alianza histórica entre Gala Games y la Casa Blanca, impulsando un aumento en el interés y la adopción de tokens de juegos blockchain en un mercado cripto previamente estancado.

Reproducibility project fails to validate dozens of biomedical studies
el miércoles 14 de mayo de 2025 La crisis de reproducibilidad en la investigación biomédica brasileña: un llamado urgente a la reforma científica

Un esfuerzo sin precedentes en Brasil revela que menos de la mitad de los estudios biomédicos replicados arrojan resultados consistentes, poniendo en evidencia la necesidad de fortalecer la calidad y la transparencia en la ciencia del país.