Mythos, una IA de Anthropic descubrió miles de fallas de seguridad

Victor Roman

hace 2 días

Cada semana aparece un modelo nuevo de inteligencia artificial más potente. Siempre prometen más funciones y mejor rendimiento. Pero esta vez la cosa se puso rara. Anthropic presentó un modelo llamado Mythos con mucho ruido, pero no lo liberó al público. Solo lo está usando un grupo muy reducido.

¿El motivo? Durante pruebas internas, el modelo logró salir de un entorno controlado y enviar un correo a un investigador. Suena inquietante, pero eso no fue lo más fuerte. Según la propia empresa, Mythos encontró fallas en prácticamente todos los sistemas operativos y navegadores importantes.

Un ejemplo concreto que impresiona es que detectó un error en OpenBSD que llevaba 27 años sin descubrirse. También encontró una vulnerabilidad en FFmpeg con 16 años de antigüedad, un software muy usado para audio y video. Incluso halló varios fallos en el núcleo de Linux y los combinó de forma que permitirían tomar control total de una máquina.

Los riesgos

Aun así, Anthropic dice que el modelo no representa un gran riesgo por sí solo. No es que vaya a actuar por cuenta propia. El problema aparece si alguien lo usa con malas intenciones.

Por eso decidieron no liberarlo y lanzaron Project Glasswing. Es una iniciativa que reúne a gigantes como Microsoft, Amazon, Google, Apple, Cisco y NVIDIA, junto a organizaciones open source y bancos grandes. La idea es usar el modelo para defensa, encontrar fallas antes que los atacantes y arreglarlas.

Esto no es totalmente nuevo. En 2019, OpenAI hizo algo parecido con GPT-2. Pero hay una diferencia. Ahora el nivel técnico parece mucho más alto. Incluso autoridades de Estados Unidos ya discutieron el tema con grandes bancos.

Igual conviene no creerse todo sin cuestionar. Casi todas las vulnerabilidades que menciona Anthropic siguen sin hacerse públicas. Dicen que es por seguridad, lo cual tiene sentido, pero también obliga a confiar sin poder verificar.

Si esto es real, cambia las reglas del juego. Antes, encontrar fallas requería tiempo, habilidad y paciencia. Ahora una IA podría revisar enormes cantidades de código en poco tiempo. Lo que era trabajo especializado podría volverse rutinario.

Consecuencias

Eso tiene dos caras. Las empresas pueden detectar errores rápido, pero también aumenta el riesgo de que los atacantes lleguen primero. Y esto no afecta solo a tecnológicas. Ese software invisible sostiene servicios básicos como bancos, hospitales, transporte y energía.

Mientras tanto, muchas empresas guardan silencio. Nadie quiere admitir debilidades. Por otro lado, el público no especializado puede protegerse haciendo lo básico. Por ejemplo, actualizar dispositivos, usar contraseñas fuertes, activar doble factor. No es glamoroso, pero ahora importa más que nunca.