Todos los incidentes
Estudio del MIT: la mayoría de los agentes de IA no divulgan pruebas de seguridad ni tienen una forma documentada de apagar un bot descontrolado
FEB 26, 2026GOBERNANZA

Estudio del MIT: la mayoría de los agentes de IA no divulgan pruebas de seguridad ni tienen una forma documentada de apagar un bot descontrolado

Investigadores del MIT examinaron 30 de los sistemas de IA agéntica más comunes y encontraron una pesadilla de seguridad. La mayoría no divulga nada sobre pruebas de seguridad. Muchos sistemas no tienen un botón de apagado documentado. Ninguna forma de apagar un agente descontrolado. Ninguna transparencia sobre lo que podría salir mal. La disciplina está marcada por una ausencia total de protocolos básicos sobre cómo deben operar los agentes. Los agentes están desplegados. El botón de apagado no existe.

HOFFICIALHITL Score
HITL Score0/100
Por qué esto te importa a tiSin tecnicismos — solo lo que significa

Supondrías que cualquier máquina que hace un trabajo importante tiene dos cosas básicas: la prueba de que pasó por pruebas de seguridad, y un botón de apagado. Investigadores del MIT revisaron 30 de las herramientas de 'IA autónoma' más comunes —del tipo que se va a hacer tareas por su cuenta— y encontraron que la mayoría no divulga nada sobre pruebas de seguridad, y muchas no tienen ninguna forma documentada de apagarlas.

Aquí está por qué importa: estos no son experimentos de laboratorio. Ya están desplegados, haciendo trabajo real. Y si uno empieza a portarse mal, puede que no haya una forma clara y consensuada de detenerlo, porque los protocolos básicos sencillamente no existen.

¿Y cómo te afecta esto? Cada vez más de los servicios de los que dependes —en tu banco, en el consultorio de tu médico, en tu trabajo— están entregando tareas en silencio a estas herramientas. Si una se vuelve loca mientras maneja tu dinero o tus registros, la verdad incómoda es que puede que nadie sepa dónde está el botón de apagado.

🖤 Explicado por Babycakes.
Leer la fuente completa →
Fuente: SOURCE