orrialde_bannerra

albisteak

Aurtengo Lasker Oinarrizko Ikerketa Medikoko Saria Demis Hassabis eta John Jumperri eman diete, aminoazidoen lehen ordenako sekuentzian oinarrituta proteinen hiru dimentsioko egitura iragartzen duen AlphaFold adimen artifizialeko sistemaren sorreran egindako ekarpenengatik.

 

Haien emaitzek zientzia-komunitatea aspalditik kezkatzen duen arazo bat konpontzen dute eta ateak irekitzen dituzte ikerketa biomedikoa bizkortzeko. Proteinek funtsezko zeregina dute gaixotasunen garapenean: Alzheimer gaixotasunean, tolestu eta elkartzen dira; minbizian, haien funtzio erregulatzailea galtzen da; jaiotzetiko metabolismo-nahasmenduetan, disfuntzionalak dira; fibrosi kistikoan, zelularen espazio okerrean sartzen dira. Hauek gaixotasunak eragiten dituzten mekanismo askoren artean batzuk besterik ez dira. Proteinen egitura-eredu zehatzek konfigurazio atomikoak eman ditzakete, afinitate handiko molekulen diseinua edo hautaketa bultzatu eta sendagaien aurkikuntza bizkortu dezakete.

 

Proteinen egiturak, oro har, X izpien kristalografia, erresonantzia magnetiko nuklearra eta krio-mikroskopia elektronikoaren bidez zehazten dira. Metodo hauek garestiak eta denbora asko eskatzen dute. Horren ondorioz, 200.000 egitura-datu baino ez dituzten 3D proteinen egituraren datu-baseak daude, DNA sekuentziazio teknologiak 8 milioi proteina-sekuentzia baino gehiago sortu dituen bitartean. 1960ko hamarkadan, Anfinsen et al.-ek aurkitu zuten aminoazidoen 1D sekuentzia modu espontaneo eta errepikagarrian tolestu daitekeela hiru dimentsioko konformazio funtzional batean (1A irudia), eta "txaperoi" molekularrek prozesu hori bizkortu eta erraztu dezaketela. Behaketa hauek 60 urteko erronka batera eramaten dute biologia molekularrean: proteinen 3D egitura aminoazidoen 1D sekuentziatik aurreikustea. Giza Genomaren Proiektuaren arrakastarekin, aminoazidoen 1D sekuentziak lortzeko dugun gaitasuna asko hobetu da, eta erronka hau are premiazkoagoa bihurtu da.

ST6GAL1-proteina-egitura

Proteinen egiturak aurreikustea zaila da hainbat arrazoirengatik. Lehenik eta behin, aminoazido guztietako atomo bakoitzaren hiru dimentsioko posizio posible guztiek ikerketa handia behar dute. Bigarrenik, proteinek osagarritasuna ahalik eta gehien erabiltzen dute beren egitura kimikoan atomoak eraginkortasunez konfiguratzeko. Proteinek normalean ehunka hidrogeno lotura "emaile" dituztenez (normalean oxigenoa), hidrogeno lotura "hartzailearen" ondoan egon beharko luketenak (normalean nitrogenoa hidrogenoari lotuta), oso zaila izan daiteke ia emaile guztiak hartzailearen ondoan dauden konformazioak aurkitzea. Hirugarrenik, metodo esperimentalen entrenamendurako adibide mugatuak daude, beraz, beharrezkoa da aminoazidoen arteko hiru dimentsioko elkarrekintza potentzialak ulertzea, proteina garrantzitsuen eboluzioari buruzko informazioa erabiliz 1D sekuentzietan oinarrituta.

 

Fisika lehen aldiz erabili zen atomoen arteko elkarrekintza modelatzeko konformazio onenaren bilaketan, eta proteinen egitura aurreikusteko metodo bat garatu zen. Karplusi, Levitti eta Warsheli 2013ko Kimikako Nobel Saria eman zieten proteinen simulazio konputazionalean egindako lanagatik. Hala ere, fisikan oinarritutako metodoak konputazionalki garestiak dira eta gutxi gorabeherako prozesamendua behar dute, beraz, ezin dira hiru dimentsioko egitura zehatzak aurreikusi. Beste "ezagutzan oinarritutako" ikuspegi bat egitura eta sekuentzia ezagunen datu-baseak erabiltzea da, adimen artifizialaren eta makina-ikaskuntzaren (AI-ML) bidez ereduak entrenatzeko. Hassabisek eta Jumperrek fisikaren eta AI-MLren elementuak aplikatzen dituzte, baina ikuspegiaren berrikuntza eta errendimendu-jauzia batez ere AI-MLtik dator. Bi ikertzaileek modu sortzailean konbinatu zituzten datu-base publiko handiak industria-mailako konputazio-baliabideekin AlphaFold sortzeko.

 

Nola dakigu egitura-aurreikuspenaren puzzlea “konpondu” dutela? 1994an, Egitura-Aurreikuspenaren Ebaluazio Kritikoa (CASP) lehiaketa sortu zen, bi urtean behin biltzen dena egitura-aurreikuspenaren aurrerapena jarraitzeko. Ikertzaileek proteina baten 1D sekuentzia partekatuko dute, zeinaren egitura duela gutxi ebatzi duten, baina zeinaren emaitzak oraindik argitaratu ez diren. Aurreikusleak hiru dimentsioko egitura aurreikusten du 1D sekuentzia hori erabiliz, eta ebaluatzaileak modu independentean epaitzen du aurreikusitako emaitzen kalitatea, esperimentalistak emandako hiru dimentsioko egiturarekin alderatuz (ebaluatzaileari bakarrik emana). CASPek benetako itsu-berrikuspenak egiten ditu eta metodologia-berrikuntzarekin lotutako aldizkako errendimendu-jauziak erregistratzen ditu. 2020ko 14. CASP Konferentzian, AlphaFold-en aurreikuspen-emaitzek errendimendu-jauzi handia erakutsi zuten, ezen antolatzaileek 3D egituraren aurreikuspenaren arazoa konpondu zela iragarri baitzuten: aurreikuspen gehienen zehaztasuna neurketa esperimentalenaren antzekoa zen.

 

Garrantzi zabalagoa da Hassabis eta Jumperren lanak modu sinesgarrian erakusten duela nola eraldatu dezakeen AI-MLk zientzia. Bere ikerketak erakusten du AI-MLk hipotesi zientifiko konplexuak eraiki ditzakeela datu-iturri anitzetatik, arreta-mekanismoek (ChatGPT-n daudenen antzekoek) mendekotasun eta korrelazio gakoak aurki ditzaketela datu-iturrietan, eta AI-MLk bere emaitzaren kalitatea autoebaluatu dezakeela. AI-ML, funtsean, zientzia egitea da.


Argitaratze data: 2023ko irailaren 23a