Arutelu üliinimliku tehisintellekti (AI) üle teravneb. Hiljutised uuringud on paljastanud nõrgad kohad ühes kõige arenenumas tehisintellekti süsteemis: robot, mis on suurepärane lauamängus Go, ületades maailma parimaid inimmängijaid. Need leiud seavad kahtluse alla selliste "üliinimeste" tehisintellekti süsteemide töökindluse ja usaldusväärsuse.
"See töö jätab märkimisväärse küsimärgi selle kohta, kuidas saavutada ambitsioonikas eesmärk luua töökindlad reaalsed tehisintellekti agendid, mida inimesed saavad usaldada," ütles Huan Zhang, Illinoisi Ülikooli Urbana-Champaigni arvutiteadlane. Stephen Casper Massachusettsi Tehnoloogiainstituudist lisas: "See annab seni tugevaimaid tõendeid selle kohta, et arenenud mudeleid on raske muuta nii, et need käituksid soovitud viisil."
Analüüs, mis on alates juunist saadaval eelpublikatsioonina ja mida ei ole veel refereeritud, kasutab vasturünnakuid - teadlikult kavandatud sisendeid, et panna tehisintellekti süsteemid vigu tegema. Need rünnakud võivad näiteks panna juturobotid avaldama kahjulikku teavet, mida nad olid välja õpetatud alla suruma.
Strateegilises lauamängus Go, kus mängijate eesmärk on ümbritseda oma vastase kivid, õpetasid 2022. aasta teadlased vasturääkivaid tehisintellektiroboteid, et võita KataGo, juhtiv avatud lähtekoodiga Go-mängu tehisintellekti süsteem. Ehkki need vastandlikud robotid ei olnud üldiselt tugevad mängijad, leidsid nad järjekindlalt võimalusi KataGo võitmiseks. Isegi inimese amatöörid, kui nad õppisid need trikid ära, suutsid KataGot võita.
KataGo haavatavuste uurimine
Et teha kindlaks, kas need haavatavused olid üksikjuhtumid või viitavad AI-süsteemide põhimõttelisele veale, juhtis FAR AI tegevjuht Adam Gleave edasisi uuringuid. Nad testisid kolme kaitsestrateegiat Go AI vastu suunatud vasturünnakute vastu.
Täiustatud koolitus: Esimene strateegia hõlmas KataGo ümberõpetamist rünnakustsenaariumide näidetega. Sellest hoolimata kaotas uuendatud KataGo ikkagi 91% ajast vastase robotitele.
Iteratiivne treening: Teine meetod oli iteratiivne treening, kus KataGo ja vastasmängijate robotid treeniti vaheldumisi üksteise vastu üheksa vooru jooksul. Vastupoolsed robotid leidsid siiski jätkuvalt nõrkusi, võites lõpuks KataGo 81% ajast.
Uus tehisintellekti süsteem: Kolmas lähenemisviis oli luua uus Go-mängimise AI, mis põhines tavalise konvolutsioonilise neuronivõrgu (CNN) asemel visioonitransformaatoril (ViT). Sellest hoolimata võitsid vastased robotid siiski 78% ajast ViT-süsteemi vastu.
Mõju tehisintellekti ohutusele ja usaldusväärsusele
Vaatamata edule KataGo vastu ei olnud need vastandlikud robotid üldiselt tugevad strateegid. "Vastasmängijad on ikka veel üsna nõrgad - me ise võitsime neid üsna kergesti," märkis Gleave. Asjaolu, et inimesed suudavad neid taktikaid kasutada, et võita ekspertide Go AI-süsteeme, seab kahtluse alla arusaama, et need süsteemid on tõeliselt üliinimlikud. "Me oleme hakanud ütlema "tavaliselt üliinimene"," märkis Gleave. David Wu, KataGo arendaja, kirjeldas tugevaid Go AI-sid kui "keskmiselt üliinimlikke", kuid mitte "halvimal juhul üliinimlikke".
Gleave rõhutas, et need tulemused võivad avaldada laialdast mõju tehisintellektile, sealhulgas suurtele keelemudelitele nagu ChatGPT. "Tehisintellekti jaoks on peamine järeldus, et neid haavatavusi on raske kõrvaldada," ütles ta. "Kui me ei suuda lahendada probleemi lihtsas valdkonnas nagu Go, siis tundub, et lähiajal on vähe väljavaateid sarnaste probleemide, nagu vanglakatkestused ChatGPT-s, lappimiseks."
Huan Zhang jõudis järeldusele, et kuigi need tulemused võivad viidata sellele, et inimestel säilivad mõned kognitiivsed eelised tehisintellekti ees, on kõige tähtsam järeldus, et praegu ehitatavate tehisintellekti süsteemide mõistmine on puudulik.
