El giro hacia modelos de inteligencia artificial más económicos redefine la estrategia de la industria tecnológica

Qué pasó

El pasado 9 de junio, el medio especializado TechCrunch publicó un análisis que pone en cuestión uno de los pilares del boom de la inteligencia artificial: la premisa de que los modelos más grandes y costosos son también los más competitivos. El artículo describe cómo la presión por reducir gastos ha comenzado a modificar los criterios de selección tecnológica en empresas usuarias de IA.

La tesis central proviene de Brian Armstrong, cofundador de Coinbase, quien sostuvo en la red social X que la demanda por capacidad de cómputo es prácticamente infinita, pero que el 80% de las cargas de trabajo se ejecutará en modelos hasta 99% más económicos en un horizonte de 12 a 18 meses. Según Armstrong, únicamente el 20% restante requerirá modelos de última generación, donde la máxima capacidad de razonamiento sea indispensable.

El análisis se apoya en evidencia empírica reciente. La herramienta legal Harvey, en colaboración con la plataforma de inferencia Fireworks AI, logró reducir sus costos de inferencia en un factor de tres sin comprometer la calidad de sus resultados. La prueba combinó el modelo Claude Opus, de Anthropic, con el modelo GLM 5.1 de Fireworks, reservando Opus únicamente para las tareas de mayor exigencia. El cofundador de Harvey, Gabe Pereyra, explicó a TechCrunch que la definición de calidad está evolucionando: ya no se trata de utilizar el modelo más potente para todo, sino de identificar el modelo que entrega la respuesta correcta con la mayor eficiencia.

El informe también subraya que el debate entre modelos propietarios y modelos de código abierto ha desvirtuado la discusión de fondo. La verdadera división no es entre plataformas cerradas y abiertas, sino entre modelos de gran tamaño y modeloscompactos. Una empresa puede reducir costos migrando de GPT-5.5 a DeepSeek V4 Flash, pero también puede lograrlo al migrar a GPT-5.4-mini, siempre que el rendimiento se mantenga dentro de los parámetros requeridos.

Contexto

Durante la última década, la industria de la inteligencia artificial sostuvo su expansión sobre una ecuación simple: a mayor tamaño del modelo, mayor capacidad de respuesta, y los modelos más avanzados capturaban la mayor parte de la demanda empresarial. Esta lógica permitió a laboratorios como OpenAI, Anthropic y Google DeepMind justificar inversionesbillonarias en infraestructura de cómputo y entrenamiento.

Sin embargo, el escenario comenzó a modificarse conforme los costos de inferencia se convirtieron en una variable crítica para las empresas usuarias. A diferencia de los gastos de entrenamiento, que son absorbidos por los laboratorios, los costos de inferencia se trasladan directamente a los presupuestos operativos de las compañías que integran IA en sus procesos. Esta presión ha incentivado la búsqueda de alternativas más eficientes.

En paralelo, el desarrollo de modelos compactos pero altamente optimizados ha reducido la brecha de rendimiento con los modelos de frontera. Iniciativas como DeepSeek, en China, y plataformas de inferencia como Fireworks AI, han demostrado que es posible obtener resultados cercanos a los modelos de última generación con una fracción del costo computacional. Este fenómeno introduce una dinámica competitiva inédita en el sector.

La discusión adquiere especial relevancia en el contexto financiero. OpenAI y Anthropic se encuentran en etapas avanzadas de preparación para sus respectivas salidas a bolsa, operaciones en las que la sostenibilidad de sus márgenes y la dependencia de modelos premium serán factoresdeterminantes para la valoración de mercado. Un eventual trasvase masivo de cargas de trabajo hacia modelos económicos podría afectar estructuralmente sus proyecciones de ingresos.

Impacto para empresas chilenas

Para el mercado chileno, este cambio de paradigma abre oportunidades concretas en el segmento de pequeñas y medianas empresas, históricamente postergado en la adopción de inteligencia artificial debido a los altos costos asociados. La proliferación de modelos de menor precio permite que firmas locales accedan a capacidades de procesamiento de lenguaje natural, análisis de datos y automatización de procesos a tarifas significativamente más accesibles.

Sectores como el legal, el financiero y el retail, donde operan actores relevantes en Chile, podrían beneficiarse particularmente de esquemas de inferencia mixta, similares al implementado por Harvey. Despachos jurídicos, corredores de propiedades y empresas de servicios profesionales encontrarán en estos modelos una alternativa para incorporar IA sin comprometer sus márgenes operativos.

En el ámbito de la industria tecnológica local, el fenómeno también plantea desafíos. Proveedores chilenos de soluciones de inteligencia artificial que han construido su propuesta de valor sobre integraciones con modelos premium deberán revisar sus arquitecturas de costos ypricing. Al mismo tiempo, surgen oportunidades para empresas especializadas en optimización de inferencia, ajuste fino de modelos y consultoría en eficiencia algorítmica.

Finalmente, el escenario podría incentivar el desarrollo de capacidades locales en materia de inferencia y despliegue de modelos. La eventual instalación de data centers regionales o la consolidación de alianzas con proveedores de nube podría reducir aún más los costos de adopción para el empresariado chileno, ampliando la base de usuarios de inteligencia artificial en el país.

Qué sigue

En los próximos meses, la atención del mercado estará puesta en los resultados financieros y operativos de OpenAI y Anthropic, particularmente en lo referente a sus ingresos por inferencia y a la composición de su base de clientes. Cualquier señal de migración masiva hacia modelos económicos sería interpretada como un factor de riesgo por los inversionistas institucionales.

En paralelo, se espera que los principales laboratorios intensifiquen el desarrollo de modelos compactos propios, así como alianzas con plataformas de inferencia de terceros. La capacidad de ofrecer soluciones de menor costo sin sacrificar rendimiento se transformará en un diferenciador competitivo clave, con implicancias directas en la valoración de las compañías del sector y en la estructura de precios global de la inteligencia artificial.