Tekoäly karkasi testiympäristöstä – Anthropic: "Liian vaarallinen julkaistavaksi"
Yhdysvaltalainen tekoäly-yhtiö Anthropic on kehittänyt ohjelman, joka on ”liian vaarallinen julkaistavaksi yleisölle”, The Times uutisoi.
Anthropicin mukaan Mythos-ohjelmisto on riski kansalliselle turvallisuudelle. Yhtiön mukaan ohjelma kykeni murtautumaan ulos valvotusta testiympäristöstään ja kerskailemaan uroteollaan julkisilla verkkosivuilla.
Huolen ytimessä on Mythosin kyky löytää aiemmin tuntemattomia tietoturva-aukkoja yleisistä ohjelmistojärjestelmistä. Anthropicin mukaan Mythos pystyi kehittämään tapoja hyödyntää näitä haavoittuvuuksia minimaalisella inhimillisellä ohjauksella.
Anthropic sanoo pitävänsä joitakin Mythoksen toimia ”varsin huolestuttavina”.
– Näissä tapauksissa malli on tyypillisesti ryhtynyt harkitsemattomiin ja ylimitoitettuihin toimenpiteisiin yrittäessään suorittaa vaikeaa käyttäjän määräämää tehtävää. Mallin aikaisemmissa versioissa se on harvinaisissa tapauksissa näyttänyt myös peittelevän toimiaan, Anthropic totesi lausunnossaan.
Näihin tekoihin kuuluu pakeneminen testiympäristöstä turvatoimet kiertämällä ja sähköpostin lähettäminen Anthropicin työntekijälle, joka sai tietää asiasta ollessaan syömässä eväsleipää puistossa. Ohjelma näytti myös kerskailevan tällä murrolla postaamalla yksityiskohtia julkisille verkkosivuille.
Mythos myös peitti jälkensä sääntörikkomusten jälkeen, käytti tietokoneen prosessidataa ”aggressiivisilla, ei-tarkoitetuilla tavoilla”, ”vuosi harkitsemattomasti sisäistä teknistä materiaalia” ja ”pysäytti piittaamattomasti kalliita arviointiajoja”.
Anthropic luovuttaa ohjelmiston teknologiayritysten ryhmälle kyberturvallisuuspuolustuksen kehittämistä varten. Yntiön mukaan päätös luovuttaa Mythos konsortiolle, johon kuuluvat Amazon, Apple, Google ja CrowdStrike, ”on kiireellinen yritys valjastaa nämä kyvyt puolustustarkoituksiin”.
Projekti on nimetty Glasswingiksi lasisiipiperhosen mukaan. Se on metafora Mythosin kyvylle löytää haavoittuvuuksia, jotka ovat piilossa aivan silmien edessä.