Hiljutises uuringus jäid tehisintellekti (AI) abil loodud eksamitööd Ühendkuningriigi Readingi ülikoolis suures osas avastamata ja said sageli kõrgemaid hindeid kui reaalsed üliõpilased. Peter Scarfe'i ja kolleegide poolt 26. juunil avatud juurdepääsuga ajakirjas PLOS ONE esitatud tulemused tõstavad esile märkimisväärseid probleeme seoses selliste tehisintellekti vahendite nagu ChatGPT kasutamisega akadeemilises keskkonnas.
Kuna tehisintellekti tööriistad on muutunud üha arenenumaks, on üha suurem mure nende võimaliku väärkasutuse pärast, mida tudengid võivad tehisintellekti abil loodud tööde esitamisel teha. Seda probleemi on süvendanud COVID-19 pandeemia ajal toimunud üleminek järelevalve all toimuvatelt personaalsetelt eksamitelt järelevalveta koduseksamitele, mida paljud õppeasutused kasutavad jätkuvalt. Praegused vahendid tehisintellekti loodud teksti tuvastamiseks on osutunud suures osas ebatõhusaks.
Uurimiseks genereerisid Scarfe ja tema töörühm täielikult tehisintellekti juturobot GPT-4 poolt kirjutatud vastuseid ja esitasid need 33 võltsitud üliõpilase nimel Readingi ülikooli psühholoogia ja kliiniliste keeleteaduste teaduskonnale. Eksamite hindajad ei olnud uuringu olemusest teadlikud.
Tulemused olid silmatorkavad: 94% tehisintellekti loodud töödest jäid avastamata ja need tööd said üldiselt kõrgemaid hindeid kui tegelike üliõpilaste omad. Konkreetselt 83,4% tehisintellekti abil loodud vastustest sai kõrgema hinde kui juhuslikult valitud rühm tegelike üliõpilaste vastuseid.
Need tulemused näitavad, et õpilased võivad mitte ainult vältida avastamist, kui nad kasutavad tehisintellekti petturluseks, vaid nad võivad saada ka paremaid hindeid kui nende eakaaslased, kes selliseid meetodeid ei kasuta. Teadlased viitavad ka sellele, et tõelised õpilased võisid uuringu käigus edukalt esitada tehisintellekti abil loodud töid.
Akadeemilise aususe seisukohalt on need tulemused murettekitavad. Teadlased pakuvad ühe lahendusena välja tagasipöördumist kontrollitud, isiklike eksamite juurde, kuid tunnistavad ka, et kuna tehisintellekti vahendid arenevad edasi ja integreeruvad erialastesse keskkondadesse, peaksid ülikoolid kaaluma, kuidas kohaneda selle "uue normaalsusega", et parandada haridust.
Autorid järeldavad: "Ülikooli reaalse eksamisüsteemi range pimekatse näitab, et tehisintellekti poolt genereeritud eksamiülesanded olid praktiliselt märkamatuid ja said kindlalt kõrgemaid hindeid kui reaalsed üliõpilased. Eksamite Turingi testi" tulemused kutsuvad ülemaailmset haridussektorit üles aktsepteerima uut normaalsust, ja just seda me Readingi ülikoolis ka teeme. Uued poliitikad ja nõuanded meie töötajatele ja üliõpilastele tunnistavad nii riske kui ka võimalusi, mida pakuvad tehisintellekti kasutavad vahendid."
Lisateave: https://www.eurekalert.org/news-releases/1048877
