Tehisintellekt (AI) on juba teinud revolutsiooni valkude uurimisel, ennustades nende 3D-struktuuri, mis on nende funktsiooni jaoks võtmetähtsusega. Nüüd on AI hakanud kasutama oma võimu palju väiksemate molekulide puhul: ravimid, herbitsiidid ja katalüsaatorid, mis on meditsiini, põllumajanduse ja tööstusliku keemia keskmes.

Teadlased teatavad täna ajakirjas Science, et uus tehisintellekti vahend suudab määrata väikeste molekulide struktuuri isegi puudulike andmete põhjal. Tööriist suudab dešifreerida mustreid andmehulgast, mis varem ei olnud piisavalt head. See lähenemisviis võib lihtsustada keemikute jaoks paljude tänapäeva elus kesksete ühendite uurimise.

"See muudab mängu," ütleb Horst Puschmann, Durhami ülikooli väikemolekulide kristallograaf, kes ei olnud töösse kaasatud.

Tehisintellekti hiljutised edusammud valkstruktuuride ennustamisel on saavutatud suuresti tänu tohutute treeninguandmete kogumite kättesaadavusele. Teadlastele on teada valke kodeerivate geenide DNA järjestused ja paljude nende valkude täpne 3D-struktuur. Nende kahe andmekogumi abil saavad teadlased treenida tehisintellekti, et ennustada täpselt uue valgu tundmatu 3D-kuju ainult selle DNA-järjestuse põhjal.

Väikemolekulide puhul on aga keerulisem väljakutse, ütleb Anders Madsen, Kopenhaageni ülikooli väikemolekulide kristallograaf. Kuigi teadlased saavad põhilisi 3D-struktuure arvutada üksnes nende keemiliste valemite põhjal, võib täpse struktuuri väljaselgitamine sageli olla võimatu, sest paljud väikesed variatsioonid on võrdselt usutavad.

Tegelike struktuuride tuvastamiseks pöörduvad teadlased tavaliselt röntgenkristallograafia poole. Nad alustavad sellega, et muudavad väikese molekuli puhastatud partii tahkeks kristalliks, kus kõik koopiad on rivistatud korduvasse mustrisse nagu puuviljad, mis on laotud toidukaupade väljapanekule. Seejärel tulistavad teadlased kristallile röntgenkiirte kiirtega. Molekuli aatomeid ümbritsevad elektronid lükkavad röntgenkiirgust kõrvale, tekitades "difraktsioonimustri", mida detektorid registreerivad. Neid mustreid analüüsides saavad teadlased kaardistada elektronide grupeeringuid ja teha kindlaks aatomite paigutuse.

Hea struktuuri saamiseks on vaja teada ka pommitavate röntgenkiirte "faasi", mis on nende lainepikkuse ja kristalli läbiva tee omadus. Kuigi detektorid suudavad mõõta röntgenkiirguse intensiivsust - sisuliselt igas punktis olevate footonite arvu -, ei saa nad mõõta nende faasi. Teadlased peavad tegema haritud oletusi, et testida kõige tõenäolisemad faasi väärtused ja kinnitada need, mis kõige paremini sobivad andmetega. Kuid liiga sageli satuvad teadlased kehvade kristallide juurde, mis tekitavad hägusaid difraktsioonimustreid, mis muudavad faasi kindlakstegemise võimatuks. "Paned rämpsu sisse, saad rämpsu välja," ütleb Andrew Bond, Cambridge'i ülikooli väikeste molekulide kristallograaf.

Kuid tehisintellektuaal suudab sageli näha mustreid ebaselgetes andmetes, mis on teadlastele nähtamatud. Madsen ja tema kolleegid asusid vaatama, kas see on siinkohal nii. Nad tegid seda tagurpidi töötades, kasutades arvutimudelit miljonite väikeste molekulide väljamõeldud struktuuride kokkukirjutamiseks ja ebaselge difraktsioonimustri arvutamiseks, mida kehvad kristallid tekitaksid. Tehisintellektuaali alustas juhuslike faasiväärtustega ja itereeris, kuni jõudis faasideni, mis kombineerituna ebaselge intensiivsuse andmetega tekitasid õige struktuuri.

Sel hetkel olid teadlastel olemas sisendid (intensiivsuse ja faasi andmed) ja väljundid (3D struktuurid) miljonite hüpoteetiliste molekulide jaoks. Nad kasutasid seda, et treenida oma tehisintellekti, et otsida mustreid, mis ühendavad intensiivsusandmeid ja faasinfot, mis koos annaksid neile õige struktuuri.

Seejärel pidid teadlased vaatama, kas koolitatud tehisintellekt suudab ennustada reaalsete molekulide struktuuri, mida ta varem ei olnud näinud. Nad leidsid, et see suudab täpselt lahendada teadaolevad struktuurid kõigi peaaegu 2400 katsetatud väikemolekuli puhul, kusjuures selleks on vaja vaid 10% traditsiooniliste röntgenmeetodite puhul vajaminevatest andmetest. "See on teatud mõttes nagu maagia," ütleb Puschmann.

Praegu töötab see tehnika ainult molekulide puhul, mis sisaldavad kuni 50 aatomit. Madsen ütleb, et ta loodab jätkata tehisintellekti täiustamist lootuses, et see saab töötada ka suuremate molekulide puhul, muutes selle seega mitmekülgsemaks tööriistaks.

Bond näeb ette, et sarnast tehisintellekti hakatakse treenima konkureerivate tehnikate, näiteks elektronkiirguse difraktsiooni andmetega, mis ei nõua kristallide valmistamist. Kuid praegu ütleb ta, et "see on tõesti hea esimene samm".
Lisateave: https://www.science.org/content/article/magic-ai-determines-structure-small-molecule-drugs-and-catalysts-even-fuzzy-data

Translated with DeepL.com (free version)