Bloomberg — Anthropic PBC está limitando el lanzamiento de su último modelo de inteligencia artificial a un puñado de grandes firmas tecnológicas, advirtiendo que el sistema puede ser capaz de potenciar ciberataques si los fabricantes de software no tienen la oportunidad de probarlo primero contra sus propias defensas.
Anthropic dijo el martes que está formando una iniciativa llamada Proyecto Glasswing con Amazon.com Inc (AMZN), Apple Inc (AAPL), Microsoft Corp (MSFT), Cisco Systems Inc (CSCO) y otras organizaciones. Las empresas obtendrán acceso al nuevo modelo de Anthropic, conocido como Mythos, para que puedan probarlo con sus propios productos y cazar vulnerabilidades. La idea es que el grupo comparta colectivamente los hallazgos con sus homólogos.
Mientras tanto, la startup de IA aún no tiene planes de lanzar Mythos al público en general. La empresa dijo que utilizará los hallazgos del Proyecto Glasswing para informar sobre los guardarraíles que debe tener la tecnología.
Ver más: Ingresos de US$30.000 millones de Anthropic impulsaron su acuerdo con Broadcom y Google
El acuerdo refleja la creciente preocupación entre las empresas tecnológicas de que los modelos más sofisticados sean utilizados indebidamente por delincuentes y piratas informáticos respaldados por el Estado para buscar fallos en el código fuente y eludir las ciberdefensas. La tecnología de IA ya se está utilizando para ayudar a perpetrar ciberataques. En un caso, un hacker utilizó herramientas de IA para facilitar una brecha que afectó al gobierno mexicano.
Durante las pruebas realizadas por Anthropic, su equipo interno de seguridad descubrió que Mythos Preview era capaz de identificar y luego explotar vulnerabilidades “en todos los principales sistemas operativos y en todos los principales navegadores web cuando un usuario se lo indicaba”, según una entrada de blog. Los exploits tampoco eran “corrientes”, dijo el equipo. En un caso, escribió un exploit para un navegador web que encadenaba cuatro vulnerabilidades.
El rival de Anthropic, OpenAI, también ha hecho hincapié anteriormente en las crecientes capacidades cibernéticas de sus modelos y presentó un programa piloto destinado a poner sus herramientas “en manos de los defensores primero”.
“Creemos que no se trata solo de un problema de Anthropic. Se trata de un problema que afecta a toda la industria y que tanto las empresas privadas como los gobiernos deben estar en condiciones de afrontar”, afirmó Newton Cheng, que dirige el esfuerzo cibernético dentro del Equipo Rojo Fronterizo de Anthropic. “Lo que intentamos hacer con Glasswing es dar a los defensores una ventaja”.
Ver más: Hasta dónde puede subir la acción de Broadcom tras sus acuerdos con Google y Anthropic
Anthropic dijo que ha discutido las capacidades de Mythos relacionadas con la seguridad con funcionarios estadounidenses, pero declinó decir con qué agencias. Cheng señaló el trabajo actual de la empresa con la Agencia de Ciberseguridad y Seguridad de las Infraestructuras y el Instituto Nacional de Normas y Tecnología.
Mythos es un modelo de IA de uso general y no se desarrolló específicamente para fines de ciberseguridad, dijo Anthropic. Sin embargo, Mythos ya ha descubierto una serie de problemas de seguridad, dijo Cheng, incluido un fallo de hace 27 años utilizado en software crítico de Internet. El sistema de IA también encontró una vulnerabilidad de 16 años de antigüedad en una línea de código de un popular software de vídeo que las herramientas de pruebas automatizadas habían escaneado cinco millones de veces pero nunca habían detectado, dijo Anthropic.
Dianne Penn, responsable de gestión de productos de investigación de Anthropic, afirmó que existen protecciones para garantizar que los miembros del Proyecto Glasswing mantienen un estricto control sobre el acceso al modelo Mythos, pero declinó compartir más detalles por motivos de seguridad.
La existencia de Mythos se reveló por primera vez gracias a una filtración a finales del mes pasado, después de que un borrador de un blog quedara disponible en un repositorio de datos de búsqueda pública.
Lea más en Bloomberg.com













