Google Research presenta nuevo marco para auditar el olvido de datos en sistemas de inteligencia artificial

12 de junio de 20264 min de lectura

Qué pasó

El equipo de Google Research, liderado por la científica Mónica Ribero, publicó esta semana un nuevo marco de auditoría bautizado como Regularized f-Divergence Kernel Tests, orientado a evaluar con mayor precisión estadística los procesos de machine unlearning en modelos de inteligencia artificial.

El machine unlearning es la capacidad de un sistema de inteligencia artificial de "olvidar" porciones específicas de los datos con los que fue entrenado, sin necesidad de reentrenar el modelo desde cero, lo que implica un costo computacional elevado. Esta capacidad resulta esencial para el cumplimiento de marcos regulatorios como el derecho al olvido contemplado en el Reglamento General de Protección de Datos (GDPR) de la Unión Europea, así como para resguardar la seguridad de los modelos y mantener estándares de calidad.

La propuesta se apoya en el método estadístico conocido como two-sample testing, que permite determinar si dos conjuntos de observaciones provienen de distribuciones subyacentes diferentes. En la práctica, los auditores comparan las respuestas de un modelo que nunca tuvo acceso a un registro específico con las de un modelo que supuestamente lo eliminó. Si las salidas difieren más allá de un umbral definido, el proceso de unlearning se considera fallido.

El desafío que aborda el nuevo marco es que, a medida que los modelos crecen en tamaño y complejidad, las herramientas estadísticas tradicionales pierden potencia y requieren un volumen creciente de muestras para identificar diferencias reales. Esto convierte la auditoría en un proceso computacionalmente costoso y, en muchos casos, inviable en escenarios productivos. Según detallan los investigadores, el nuevo enfoque controla teóricamente los falsos positivos para cualquier tamaño de muestra y reduce el riesgo de falsos negativos a medida que se incrementa la cantidad de datos disponibles.

Contexto

La industria tecnológica global enfrenta una presión creciente por demostrar que los sistemas de inteligencia artificial cumplen efectivamente con las normativas de protección de datos personales. La proliferación de modelos entrenados con grandes volúmenes de información sensible ha colocado al machine unlearning en el centro del debate regulatorio en Europa, Estados Unidos y, de forma incipiente, en América Latina.

El Reglamento General de Protección de Datos de la Unión Europea establece que los ciudadanos tienen derecho a solicitar la eliminación de sus datos personales de los sistemas que los procesan. Cuando esos sistemas son modelos de inteligencia artificial, el cumplimiento de esta disposición no puede resolverse simplemente borrando registros de una base de datos, ya que la información puede haber quedado incorporada en los parámetros del modelo. Esto ha generado una demanda concreta por mecanismos verificables de olvido.

En paralelo, organismos internacionales y autoridades de competencia han comenzado a evaluar la trazabilidad de los datos utilizados en el entrenamiento de modelos de lenguaje y visión computacional. La capacidad de auditar de forma independiente el comportamiento de un modelo, sin acceso a su arquitectura interna ni a los datos originales de entrenamiento, se ha convertido en un requisito técnico indispensable.

El trabajo de Google Research se inscribe en una línea de investigación más amplia que busca desarrollar herramientas estadísticas capaces de operar sobre modelos opacos, es decir, aquellos cuyo funcionamiento interno no es completamente accesible para auditores externos. En este escenario, los métodos de two-sample testing se posicionan como una alternativa viable, aunque requieren mejoras sustanciales en eficiencia y precisión para escalar a sistemas de gran tamaño.

Impacto para empresas chilenas

Para el ecosistema empresarial chileno, el desarrollo de marcos de auditoría más eficientes para machine unlearning tiene implicancias directas en la forma en que las compañías locales adoptan soluciones de inteligencia artificial. Si bien la regulación chilena de protección de datos personales aún se encuentra en una etapa de consolidación, la tendencia internacional apunta hacia estándares más exigentes que, tarde o temprano, se proyectarán al mercado local.

Las empresas chilenas que utilizan modelos de inteligencia artificial provistos por proveedores globales, ya sea en servicios financieros, retail, salud o recursos humanos, enfrentan el desafío de acreditar ante sus clientes y reguladores que la información sensible es tratada conforme a la ley. Contar con herramientas de auditoría estadística robustas facilita este proceso y reduce la dependencia de declaraciones unilaterales por parte de los proveedores tecnológicos.

En el segmento de las pequeñas y medianas empresas, la posibilidad de verificar de manera independiente el cumplimiento de los compromisos de privacidad puede transformarse en un factor diferenciador. Las pymes que operan como proveedoras de datos o que integran inteligencia artificial en sus procesos podrán exigir a sus socios tecnológicos estándares verificables de olvido, lo que fortalece su posición contractual y reduce riesgos reputacionales.

Adicionalmente, el desarrollo de estas metodologías abre oportunidades para la industria local de servicios de consultoría y auditoría tecnológica, un segmento en expansión que podría especializarse en certificar procesos de machine unlearning para empresas que operan tanto en Chile como en mercados con regulación más madura.

Qué sigue

La presentación de Regularized f-Divergence Kernel Tests en AISTATS 2026 marca un avance metodológico relevante, pero su adopción efectiva dependerá de la validación que realice la comunidad científica y de la disposición de los proveedores de modelos para integrar mecanismos de auditoría compatibles con este tipo de pruebas.

En el mediano plazo, es esperable que organismos reguladores y entidades de estandarización técnica incorporen requisitos explícitos de verificabilidad del olvido algorítmico. Esto obligará a las empresas que desarrollan o implementan inteligencia artificial a invertir en infraestructura de auditoría estadística, lo que probablemente impulse el surgimiento de nuevas soluciones y servicios especializados en el mercado regional.

Fuente:Google Research Blog

¿Listo para automatizar la atención a tus clientes?

Construye un chatbot inteligente que responda preguntas frecuentes, integre IA y trabaje 24/7. Sin código, en minutos.

Construye tu chatbot

Respuesta en menos de 24h · Cotizacion sin compromiso

Artículos Relacionados

Google rediseña por primera vez en 25 años su icónica caja de búsqueda y la transforma en un asistente conversacional con IA

En el marco de su conferencia anual I/O, Google presentó la modificación más profunda del componente central de su motor de búsqueda desde su creación. La nueva interfaz admite consultas multimodales, integra sus funciones de inteligencia artificial y elimina la separación entre los resultados tradicionales y las respuestas generativas. El cambio constituye un punto de inflexión en la estrategia de Alphabet, que apuesta por convertir la búsqueda en una experiencia conversacional sostenida por modelos de lenguaje.

8 jun 20264 min

Amazon habilita el diseno de merchandising personalizado mediante inteligencia artificial

Amazon incorporo una nueva funcionalidad que permite a los usuarios crear articulos personalizados a partir de comandos de inteligencia artificial. La herramienta opera a traves del asistente Alexa, integrado en la aplicacion de compras de la compania, y se conecta con el servicio de impresion bajo demanda Merch on Demand. La iniciativa representa una expansion directa hacia plataformas especializadas como Redbubble, Bonfire, Spring y Fourthwall. Inicialmente, la opcion se encuentra disponible unicamente para usuarios en Estados Unidos, sin costo adicional por el uso del software.

8 jun 20265 min

Apple presenta mejoras sustanciales en su aplicación de generación de imágenes Image Playground

Apple anunció en la WWDC 2026 una renovación profunda de Image Playground, su herramienta de generación de imágenes basada en inteligencia artificial. La compañía busca cerrar la brecha con competidores como OpenAI y Google, incorporando procesamiento de lenguaje natural y mayor integración con el ecosistema iOS. La propuesta se diferencia por un enfoque reforzado en privacidad, con procesamiento mediante private cloud compute que impide el uso de las fotografías del usuario para entrenar modelos.

8 jun 20264 min