Estafas Cripto y Seguridad

IBM Granite 4.0 Tiny Preview: Revolucionando los Modelos de Lenguaje con Eficiencia y Potencia

Estafas Cripto y Seguridad
IBM Granite 4.0 Tiny Preview

IBM presenta Granite 4. 0 Tiny Preview, un modelo de lenguaje innovador que combina arquitectura híbrida, eficiencia computacional y capacidades de contexto largo, accesible para desarrolladores con hardware modesto.

En el dinámico mundo de la inteligencia artificial y los modelos de lenguaje, IBM continúa marcando la pauta con el lanzamiento preliminar de su modelo Granite 4.0 Tiny Preview. Esta versión anticipada es una muestra clara del compromiso de IBM por ofrecer modelos que no solo cuentan con un rendimiento sobresaliente, sino que también optimizan el uso de recursos computacionales, permitiendo a desarrolladores y empresas acceder a tecnología avanzada sin la necesidad de infraestructuras costosas. Granite 4.0 Tiny Preview representa la punta de lanza en la familia Granite 4.

0, un conjunto de modelos de lenguaje cuya característica principal es la eficiencia en memoria y procesamiento, al tiempo que conserva una alta precisión y capacidad de manejo de contextos extensos. Disponible para la comunidad open source a través de Hugging Face bajo licencia Apache 2.0, este modelo está diseñado para funcionar en hardware de consumo común, incluyendo GPUs de precio accesible que no superan los 350 dólares estadounidenses. La importancia de un modelo tan compacto radica en su capacidad para ejecutar múltiples sesiones concurrentes que requieren un contexto largo, alcanzando hasta 128 mil tokens, una escala que hasta ahora estaba reservada para sistemas computacionales mucho más preparados y costosos. Este nivel de rendimiento en entornos modestos abre las puertas a una democratización en el acceso a herramientas necesarias para la innovación en procesamiento del lenguaje natural.

Granite 4.0 Tiny es un modelo parcialmente entrenado, habiendo sido expuesto a 2.5 billones de tokens de un objetivo mínimo de 15 billones o más. A pesar de su estado preliminar, demuestra un rendimiento comparable al modelo IBM Granite 3.3 2B Instruct, pero con una demanda de memoria significativamente menor, cerca del 72% menos, lo que supone un avance importante en términos de eficiencia.

IBM proyecta que una vez finalizado su entrenamiento y sus procesos de afinamiento adicionales, Granite 4.0 Tiny estará a la altura del rendimiento del Granite 3.3 8B Instruct. Una de las mayores revoluciones que presenta Granite 4.0 Tiny Preview es su arquitectura híbrida que combina Mamba-2 y transformadores, un enfoque innovador que reúne la eficiencia del modelo Mamba con la precisión del mecanismo de autoatención típico de los transformadores.

Este modelo es un sistema de mezcla de expertos (Mixture of Experts - MoE), con 7 mil millones de parámetros en total, pero que utiliza solamente 1 mil millones activos durante la inferencia, optimizando así el consumo de recursos. El origen de Mamba se remonta a 2023, cuando académicos de Carnegie Mellon y Princeton desarrollaron un modelo de espacio de estados estructurado (SSM) denominado S4, que más tarde evolucionó al modelo llamado Mamba. Este enfoque busca superar algunas limitaciones inherentes a la arquitectura transformadora, sobre todo la escalabilidad en cuanto a largos contextos y uso eficiente de memoria y cómputo. Mientras que el mecanismo de autoatención en los transformadores tiene un costo computacional que crece cuadráticamente según la longitud del contexto, Mamba se caracteriza por una escalabilidad lineal, lo que significa que al duplicar la longitud de la secuencia de entrada, solo duplica los recursos requeridos. Esta particularidad convierten a la arquitectura Mamba en una opción ideal para aplicaciones que demandan el manejo de contextos extremadamente largos.

Sin embargo, los transformadores poseen ventajas notables en tareas que requieren aprendizaje en contexto, copia de información o razonamiento sobre largos períodos, debido a la riqueza de información que retienen y al tratamiento completo y detallado de cada token de entrada. Para aprovechar lo mejor de ambos mundos, Granite 4.0 emplea un diseño híbrido donde nueve bloques Mamba trabajan en conjunto con un único bloque transformador. Así, la arquitectura Mamba captura de forma eficiente el contexto global, mientras que los bloques transformadores aportan un análisis local más detallado y preciso. Además, Granite 4.

0 Tiny utiliza un esquema avanzado de mezcla de expertos que permite seleccionar dinámicamente los módulos más relevantes para cada tarea de inferencia, mejorando la eficiencia y reduciendo el consumo de memoria sin sacrificar calidad en la salida generada. Esta combinación de técnicas refuerza la apuesta de IBM por modelos que puedan implementarse eficazmente en equipos accesibles para medianas y pequeñas empresas. Otro aspecto fundamental de Granite 4.0 Tiny es su manejo singular del orden de las palabras en una secuencia. A diferencia de los modelos transformer tradicionales que emplean encodings posicionales como rotary positional encoding (RoPE), los cuales pueden limitar la capacidad de generalización a secuencias más largas, Granite 4.

0 opta por no usar codificaciones posicionales (NoPE). Los ensayos realizados muestran que esta decisión no impacta negativamente el rendimiento en contextos extendidos, alcanzando y superando con comodidad los 128 mil tokens; una demostración de la robustez y flexibilidad del modelo para ser utilizado en escenarios que demandan procesamiento a gran escala. A nivel práctico, esta característica elimina una fuente importante de sobrecarga computacional que suele afectar a otros modelos, permitiendo que el despliegue a contextos aún más extensos dependa únicamente de la capacidad del hardware disponible. Por lo tanto, Granite 4.0 se adapta a diversas necesidades, desde aplicaciones sencillas y de bajo consumo, hasta escenarios de análisis de documentos muy largos y otras tareas de inteligencia artificial avanzada.

IBM también tiene planes claros para la integración y soporte del modelo a través de plataformas populares del ecosistema open source como Hugging Face transformers y vLLM, así como para su ejecución local mediante socios como Ollama y LMStudio. Esto permitirá a desarrolladores y empresas implementar Granite 4.0 con relativa facilidad y aprovechar sus ventajas sin necesidad de depender exclusivamente de infraestructuras en la nube o hardware especializado. En cuanto a sus aplicaciones, Granite 4.0 Tiny, como parte de la serie Granite, promete ser útil en una gran variedad de áreas empresariales, desde ciberseguridad hasta recuperación de información y generación asistida de contenidos, aplicando también en procesos complejos que requieren razonamiento, comprensión contextual profunda y manejo eficiente de instrucciones complejas.

Su rapidez, coste reducido y flexibilidad lo posicionan como un recurso valioso para acelerar la adopción de inteligencia artificial en distintos sectores. El camino por recorrer incluye continuar con el entrenamiento intensivo del modelo y su afinamiento post-entrenamiento, mejorando sus capacidades de razonamiento y respuesta y asegurando que se mantenga alineado con las exigencias de seguridad y operativas de la industria. IBM planea compartir más avances y detalles de la evolución de Granite 4.0 en eventos próximos como IBM Think 2025, así como a través de actualizaciones periódicas a la comunidad. En resumen, Granite 4.

0 Tiny Preview no solo representa un avance tecnológico en términos de arquitectura y eficiencia, sino que también reafirma el compromiso de IBM con la accesibilidad y la apertura en inteligencia artificial. Con un modelo que puede ejecutarse en hardware asequible, ofreciendo altos niveles de rendimiento y capacidad de manejar contextos extremadamente largos, IBM impulsa una democratización real de la tecnología LLM, estimulando la innovación y ampliando el espectro de posibles aplicaciones en empresas de todos los tamaños.

Trading automático en las bolsas de criptomonedas Compra y vende tu criptomoneda al mejor precio

Siguiente paso
Why WeRide Inc. (WRD) is Among the Best Small Cap Stocks to Buy with the Biggest Upside Potential
el jueves 05 de junio de 2025 Por qué WeRide Inc. (WRD) es una de las mejores acciones de pequeña capitalización con mayor potencial de crecimiento

Exploramos las razones que hacen de WeRide Inc. (WRD) una opción atractiva en el mercado de acciones de pequeña capitalización, analizando su potencial de crecimiento y el contexto económico que favorece su inversión.

Why Cartesian Therapeutics, Inc. (RNAC) is Among the Best Small Cap Stocks to Buy with the Biggest Upside Potential
el jueves 05 de junio de 2025 Cartesian Therapeutics, Inc. (RNAC): Una Oportunidad Única en el Mercado de Small Caps con Gran Potencial de Crecimiento

Descubre por qué Cartesian Therapeutics, Inc. (RNAC) se posiciona como una de las mejores acciones de pequeña capitalización para invertir, destacando su potencial de rentabilidad, factores macroeconómicos y el contexto actual del mercado que influyen en su valoración y perspectivas futuras.

Why Uber Rallied Double-Digits in April
el jueves 05 de junio de 2025 El Auge de Uber en Abril: Claves del Rally de Más del 11% en el Mercado

Uber experimentó un significativo crecimiento en su valor durante abril, impulsado por innovadoras alianzas en tecnología autónoma y una resistencia económica sorprendente. Este análisis detalla las razones detrás del fuerte rendimiento bursátil de Uber y su mirada estratégica hacia el futuro del transporte.

Ackman's Pershing Square to boost Howard Hughes stake with $900 million investment
el jueves 05 de junio de 2025 Bill Ackman impulsa su participación en Howard Hughes con una inversión de 900 millones de dólares

Bill Ackman refuerza su control en Howard Hughes con una millonaria inversión, buscando transformar la empresa inmobiliaria en un conglomerado diversificado inspirado en Berkshire Hathaway. Esta estrategia promete dinamizar la gestión de activos y la adquisición de nuevas compañías, redefiniendo el futuro del holding bajo su visión.

Five China Stocks Near Buy Points Amid Trump Tariff Trade War Hopes
el jueves 05 de junio de 2025 Cinco Acciones Chinas Cerca de Puntos de Compra ante la Esperanza del Fin de la Guerra Comercial con Trump

El optimismo crece en los mercados chinos tras el acuerdo para reducir aranceles entre Estados Unidos y China, impulsando a importantes empresas tecnológicas y fabricantes de vehículos eléctricos cerca de puntos estratégicos de entrada para inversionistas.

Market Digest: BAX, CAH, CCEP, EPD, EQIX, GILD, MCO, MGM, MSI, RJF, RTX, GM, META, APTV, XYZ
el jueves 05 de junio de 2025 Análisis Completo del Mercado: Perspectivas y Tendencias Clave de Empresas Líderes en 2025

Exploración detallada del comportamiento reciente y perspectivas futuras de algunas de las principales empresas en sectores diversos como tecnología, energía, servicios financieros y consumo, en un contexto económico marcado por las decisiones de la Reserva Federal y resultados corporativos claves.

ANZ to support password-free web banking from mid-2025
el jueves 05 de junio de 2025 ANZ Revoluciona la Banca Digital con Acceso Sin Contraseñas a Partir de 2025

ANZ implementará una innovadora plataforma de banca web sin contraseña para mejorar la seguridad y la experiencia del usuario, utilizando autenticación biométrica y tecnologías avanzadas que transforman el acceso digital a las cuentas bancarias en Australia y Nueva Zelanda.