Larry Richardson näis olevat potentsiaaliga matemaatikakandidaat karjääri alguses. Google Scholar'i andmetel oli ta kirjutanud tosinat tööd erinevatel teemadel alates kompleksalgebratest kuni matemaatiliste objektide struktuurini, kogudes nelja aasta jooksul üle 130 tsiteeringu. See kõik oleks üsna tähelepanuväärne - kui need uurimused ei oleks täielik jama. Ja Larry ei olnud kass.

"See oli absurdne harjutus," ütleb Northwesterni ülikooli metateaduse ja arvutusliku bioloogia magistrant Reese Richardson. Selle kuu alguses valmistasid ta ja tema kolleeg Nick Wise Cambridge'i ülikoolist Larry profiili välja ja korraldasid kassikarja teadusliku tõusu. Nende eesmärk oli teha temast maailma enim tsiteeritud kass, jäljendades taktikat, mida ilmselt kasutab Facebookis reklaamitav tsiteerimist suurendav teenus. Vaid kahe lühikese nädalaga täitis duo oma missiooni.

Peter Lange, kõrghariduse konsultant ja Duke'i ülikooli politoloogia emeriitprofessor, arvab, et see trikk juhib loodetavasti teadlikkust teadustöö näitajatega manipuleerimise kasvavast probleemist. "Ma arvan, et enamik minu teadaolevate asutuste õppejõududest ei ole sellistest tsitaadiveskitest isegi teadlikud."

Üldreeglina kehtib, et mida rohkem tsiteeritakse teadustööd teistes uuringutes, seda olulisemad on see ja selle autorid antud valdkonnas. Üks lühend on populaarne "h-indeks": H-indeks 10 tähendab, et inimesel on näiteks 10 tööd, millest igaüht on vähemalt 10 tsiteeritud.

Teadlase tsitaatide arvu ja h-indeksi paisutamine annab talle "tohutu eelise" töölevõtmise ja ametikoha määramise otsuste tegemisel, ütleb Sydney ülikooli vähiuurija Jennifer Byrne. Samuti on see aluseks hämarate organisatsioonide ärimudelile, mis lubavad raha eest suurendada teie tsiteeringuid. "Kui saab lihtsalt tsitaate osta," ütleb Byrne, "siis ostad mõju".

Sisestage Larry the cat. Tema lugu algas paar nädalat tagasi, kui Wise nägi Facebooki reklaami, mis pakkus "tsitaatide ja h-indeksi suurendamist". See ei olnud esimene reklaam, mida ta ja Richardson selliste teenuste kohta nägid. (Tundub, et hind on umbes 10 dollarit tsitaadi kohta.) Kuid see reklaam oli seotud Google Scholar'i profiilide ekraanipiltidega, mis sisaldasid tõelisi teadlasi. See tähendas, et duo sai näha, millised tsitaadid tõstsid numbreid.

Selgus, et need tsitaadid kuulusid sageli töödele, mis olid täis mõttetut teksti, mille autoriteks olid ammu surnud matemaatikud, näiteks Pythagoras. Uuringud olid üles laaditud PDF-failidena akadeemilisele suhtlusplatvormile ResearchGate ja seejärel kustutatud, mistõttu nende olemus jäi varju. (Wise ja Richardson pidid dokumentide lugemiseks Google'i vahemällu kaevama.) "Me mõtlesime: "Vau, see protseduur on uskumatult lihtne," meenutab Richardson. "Tuleb vaid panna ResearchGate'ile mõned võltsitud paberid."

See on nii lihtne, märkis Wise toona, et kiirelt kirjutatud skript usutavalt kõlavate paberite välja pumpamiseks võib teha kellestki kõrgelt tsiteeritud - isegi kassist. "Ma ei tea, kas ta mõtles tõsiselt," ütleb Richardson. "Aga ma võtsin seda kindlasti kui väljakutset." Ja ta teadis, millist kassi võita: F. D. C. Willard. 1975. aastal lisas teoreetiline füüsik Jack Hetherington ühele oma ühe autori tööle oma siiami, et viited "me" oleksid mõistlikumad. Selle aasta seisuga on "Felis Domesticus Chester Willardil" 107 viidet.

Selle rekordi ületamiseks pöördus Richardson oma vanaema kassi Larry poole. Umbes tunni aja jooksul lõi ta 12 võltsitud tööd, mille autoriks oli Larry ja 12 teist, mis viitasid iga Larry töödele. See teeb kokku 12 tööd, millest igaühele on tehtud 12 tsitaati, mis teeb kokku 144 tsitaati ja h-indeksi 12. Richardson laadis käsikirjad üles ResearchGate'i profiilile, mille ta lõi kassipoole jaoks. Seejärel ootasid ta ja Wise, kuni Google Scholar automaatselt võltsitud andmed kokku kraapib.

17. juulil ilmusid Larry tööd ja 132 tsitaati saidile. (Wise märgib, et Google Scholar ei tabanud üht võltsitud uuringut.) Ja nii sai Larryst maailma enim tsiteeritud kass. "Küsisin Larrylt telefoni teel, milline oli tema reaktsioon," ütles Richardson Science'ile. "Võin vaid oletada, et ta oli liiga jahmunud, et rääkida."

Kuigi Larry profiil võib tunduda ilmselgelt võltsitud, ei ole manipuleeritud profiilide leidmine tavaliselt lihtne, ütleb Talal Rahwan, New Yorgi Ülikooli Abu Dhabi arvutiteadlane. Selle aasta alguses skaneerisid ta ja sama asutuse arvutiteadlane Yasir Zaki koos oma kolleegidega rohkem kui 1 miljon Google Scholar'i profiili, et otsida anomaalseid tsitaatide arvu. Nad leidsid veebruaris arXiv preprint serveris avaldatud dokumendi kohaselt vähemalt 114 "väga ebakorrapärase tsitaatimustriga". "Valdav enamus neist oli vähemalt osa kahtlastest tsitaatidest pärit ResearchGate'ist," ütleb Zaki.

ResearchGate on "loomulikult teadlik kasvavatest teadusuuringute terviklikkuse probleemidest ülemaailmses teaduskogukonnas," ütleb ettevõtte tegevjuht Ijad Madisch. "[Me] vaatame pidevalt läbi oma poliitikaid ja protsesse, et tagada parim kogemus meie miljonitele teadlastest kasutajatele." Ta ütleb, et sel juhul ei olnud ettevõte teadlik sellest, et tsitatsiooniveskid kustutavad sisu pärast indekseerimist, ilmselt selleks, et varjata oma jälgi - see võib aidata ResearchGate'il välja töötada paremaid järelevalvesüsteeme. "Oleme tänulikud Science'ile, kes meile sellest konkreetsest olukorrast teatas, ning kasutame seda aruannet oma protsesside läbivaatamiseks ja kohandamiseks vastavalt vajadusele."

Google Scholar eemaldas Larry tsitaadid umbes 1 nädal pärast nende ilmumist, seega on ta kaotanud oma mitteametliku tiitli. Tema profiil on aga endiselt olemas ja kahtlased tsitaadid profiilides, mis olid kuulutuses, on endiselt olemas. Seega "nad ei ole probleemi parandanud," ütleb Wise. Google Scholar ei vastanud kommentaaritaotlustele.

See ei ole esimene kord, kui keegi manipuleerib Google Scholariga võltsitud paberite avaldamisega. 2010. aastal leiutas Grenoble Alpes'i ülikooli arvutiteadlane Cyril Labbé teadlase nimega Ike Antkare ("Ma ei saa hoolida") ja tegi temast teenuse kuuenda enim tsiteeritud arvutiteadlase, postitades Labbé institutsionaalsele veebisaidile võltsitud publikatsioone. "Kassis võltsitud teadlase kehastamine on väga armas," ütleb Labbé. "Kui seda saab teha kassi puhul, siis saab seda hõlpsasti teha ka päris inimese puhul."

Sel põhjusel sooviksid paljud teadlased, et h-indeksile ja muudele mõõdikutele, millel on "liigne kvantifitseerimise sära", nagu Lange ütleb, vähem rõhku pandaks. Kuni nende süsteemide manipuleerimisest saadav kasu kaalub üles riskid ja kulud, ütleb Wise, püüavad inimesed neid jätkuvalt häkkida. "Kuidas saab luua mõõteriista, mida ei saa võltsida? Olen kindel, et vastus on: ei saa."
Lisateave: https://www.science.org/content/article/how-easy-it-fudge-your-scientific-rank-meet-larry-world-s-most-cited-cat