Saltar al contenido principal
IA

IBM presenta Granite Embedding Multilingual R2: modelos abiertos con contexto extendido de 32K

14 de mayo de 20263 min de lectura
IBM presenta Granite Embedding Multilingual R2: modelos abiertos con contexto extendido de 32K

Qué pasó

El 14 de mayo de 2026, a través del blog oficial de Hugging Face, IBM anunció el lanzamiento de Granite Embedding Multilingual R2. Esta familia de modelos de inteligencia artificial está diseñada específicamente para resolver la búsqueda de información en múltiples idiomas de manera simultánea.

La compañía liberó dos versiones distintas. La primera es un modelo robusto de 311 millones de parámetros, que genera representaciones vectoriales de 768 dimensiones y logra una puntuación de 65.2 en la evaluación MTEB Multilingual Retrieval. La segunda es una versión compacta de 97 millones de parámetros, con representaciones de 384 dimensiones, que ostenta el primer lugar en calidad de recuperación frente a cualquier modelo abierto de menos de 100 millones de parámetros, alcanzando un puntaje de 60.3.

Ambas arquitecturas ofrecen un salto significativo en su capacidad de procesamiento. Pueden manejar secuencias de texto de hasta 32.768 tokens, lo que representa un aumento de 64 veces respecto a su iteración anterior. Además, cubren más de 200 idiomas, con un rendimiento optimizado para 52 de ellos, e integran la capacidad de búsqueda y recuperación de código

Desde el punto de vista técnico, los modelos están construidos sobre la base de ModernBERT e incluyen soporte para Matryoshka Embeddings, una técnica que permite reducir la dimensionalidad sin perder precisión. Son compatibles de manera inmediata con marcos de desarrollo populares como LangChain, LlamaIndex, Haystack y Milvus, lo que facilita su adopción corporativa.

Contexto

En el ecosistema tecnológico actual, los modelos de representación vectorial son el pilar fundamental para la Generación Aumentada por Recuperación (RAG) y los sistemas de búsqueda empresarial. Tradicionalmente, las compañías se enfrentaban a una disyuntiva: utilizar modelos pesados y costosos capaces de entender múltiples idiomas, o optar por versiones ligeras que sacrificaban la cobertura lingüística y la precisión semántica.

El mercado exige cada vez más analizar documentos extensos, como contratos o manuales técnicos, sin fragmentar la información. Un contexto de 32.000 tokens permite a las empresas procesar estos textos en una sola operación, manteniendo la coherencia del documento original, un requisito indispensable para el sector legal y financiero.

La estrategia de IBM de liberar estos modelos bajo la licencia Apache 2.0 se enmarca en un movimiento de la industria por democratizar el acceso a herramientas de inteligencia artificial de grado corporativo. Al ofrecer pesos optimizados para procesadores estándar mediante las bibliotecas ONNX y OpenVINO, se reduce la barrera de entrada y la dependencia de hardware especializado de alto costo.

Impacto para empresas chilenas

Para el mercado local, el lanzamiento de estos modelos representa una oportunidad concreta para las pequeñas y medianas empresas (pymes) y startups chilenas que buscan integrar capacidades de búsqueda inteligente. El modelo compacto de 97 millones de parámetros permite ejecutar búsquedas en infraestructuras de bajo costo, haciendo viable la adopción tecnológica sin grandes desembolsos de capital.

En el caso de las grandes empresas nacionales, la industria bancaria, el sector retail y los servicios públicos manejan voluminosas bases de datos documentales. La capacidad de procesar hasta 32.000 tokens permite indexar textos regulatorios y contratos extensos con un alto nivel de comprensión contextual, mejorando la eficiencia operativa y la trazabilidad de la información.

Asimismo, la compatibilidad multilingüe beneficia directamente a la industria tecnológica local y a los centros de desarrollo de software que operan con clientes internacionales. La integración directa con marcos de trabajo estándar permite a los equipos de ingeniería adoptar esta tecnología modificando una sola línea de código, acelerando el despliegue de nuevas soluciones y reduciendo los tiempos de desarrollo.

Qué sigue

El impacto de esta liberación sugiere que, en el corto plazo, se producirá una estandarización de los sistemas de búsqueda corporativa multilingüe. Las empresas migrarán gradualmente hacia arquitecturas de código abierto, abandonando la dependencia de proveedores exclusivos para el procesamiento de lenguaje natural.

De cara al futuro, se anticipa que la industria continuará compitiendo por ampliar las ventanas de contexto y mejorar la eficiencia computacional. Esta tendencia obligará a los proveedores de infraestructura en la nube a adaptar sus servicios para soportar modelos vectoriales cada vez más robustos de manera nativa, consolidando la inteligencia artificial como un componente básico en las operaciones de análisis de datos corporativos.

IA

¿Listo para automatizar la atención a tus clientes?

Construye un chatbot inteligente que responda preguntas frecuentes, integre IA y trabaje 24/7. Sin código, en minutos.

Construye tu chatbot

Artículos Relacionados

Fundadores con experiencia en Goldman Sachs y Meta crean plataforma de IA de voz para mercados emergentes
IA

Fundadores con experiencia en Goldman Sachs y Meta crean plataforma de IA de voz para mercados emergentes

La startup AethexAI recaudó US$ 3 millones en una ronda pre-seed para desarrollar tecnología de inteligencia artificial enfocada en mercados de África y Medio Oriente. La empresa construyó sus propios modelos de lenguaje reducidos para mitigar problemas de latencia y adaptar la tecnología a dialectos locales. Su enfoque busca resolver las barreras técnicas que han impedido la adopción de IA conversacional en regiones emergentes.

3 jun 20263 min
Amazon implementará imágenes generadas por inteligencia artificial en sus resultados de búsqueda
IA

Amazon implementará imágenes generadas por inteligencia artificial en sus resultados de búsqueda

La plataforma de comercio electrónico Amazon anunció la integración de imágenes generadas por inteligencia artificial en su motor de búsqueda. La iniciativa busca orientar a los consumidores cuando utilizan términos imprecisos, mostrando fotografías sintéticas de productos. Expertos del sector cuestionan la medida, señalando que podría generar confusión entre los usuarios al mostrar artículos que no existen físicamente en el inventario.

3 jun 20263 min
Coralogix levanta US$ 200 millones para desarrollar la capa de monitoreo de agentes de inteligencia artificial
IA

Coralogix levanta US$ 200 millones para desarrollar la capa de monitoreo de agentes de inteligencia artificial

La empresa israelí-estadounidense Coralogix recaudó US$ 200 millones en una ronda Serie F, alcanzando una valoración de US$ 1.600 millones. La inversión refleja la creciente demanda de herramientas de observabilidad para sistemas de inteligencia artificial autónomos. Este financiamiento se suma a los US$ 115 millones obtenidos hace 11 meses, totalizando US$ 550 millones levantados hasta la fecha.

3 jun 20264 min