Pensionil olev insener Gerald Piosenka lõi andmestiku 2019. aastal, laadides alla laste fotosid „autismi teemalistelt veebisaitidelt“, vastavalt andmestiku meetodite kirjeldusele, ja laadides selle üles Kaggle'ile, Google'ile kuuluvale saidile, mis majutab masinõppe praktikutele mõeldud avalikke andmekogumeid.
Ilma iga lapse andmestikus tuvastamata pole võimalik kinnitada, kas kellelgi neist on autism või mitte, ütleb Dorothy Bishop, Oxfordi ülikooli arenguneuropsühholoogia emeriitprofessor. Andmestik jõudis Springer Nature'i tähelepanu alla esmakordselt eelmisel kuul kahe eraldi uurimistöö kaudu.
Springer Nature'i teadusuuringute terviklikkuse meeskond oli just alustamas ühe „murettekitava artikli“ uurimist, kui Toulouse'i ülikooli arvutiteaduse professor Guillaume Cabanac teavitas meeskonda teisest, mis sisaldas piinatud fraase – kummalisi fraase, mida kasutati tavaliste asemel, mis võib viidata sellele, et tekst on loodud tehisintellekti abil. Mõlemas artiklis kasutati Piosenka koostatud fotoandmestikku.
