Inteligența artificială rezolvă puzzle-ul 3D al structurii proteinelor

Compania DeepMind din Marea Britanie a rezolvat, fără îndoială, una dintre cele mai mari provocări cu care s-a confruntat biologia de câteva decenii – problema plierii proteinelor – folosind un sistem AI cunoscut sub numele de AlphaFold1.

Programul DeepMind a depășit în jur de alte 100 de echipe într-o provocare de predicție a structurii proteinelor. Rezultatele au fost anunțate în data de 30 noiembrie.

O nouă soluție la problema veche și complexă a structurii?

Proteinele sunt elementele constitutive ale vieții, responsabile pentru majoritatea proceselor ce se întâmplă în interiorul celulelor. Cum funcționează o proteină și ce face este determinat de forma sa 3D; „structura este funcție” este o axiomă a biologiei moleculare. Proteinele tind să-și adopte forma fără ajutor, ghidate doar de legile fizicii.

Proteinele sunt macromolecule care efectuează procesele fiziologice ce stau la baza vieții, atât la om, cât și la alte organisme. Studierea proteomului, identificarea proteinelor, caracterizarea și analizarea biologiei acestora este centrul domeniului de cercetare proteomică care a crescut și a avansat cu o rată impresionantă în ultimii ani.

Timp de decenii, experimentele din laboratoare au fost principala modalitate de a obține structuri proteice, însă nu tridimensionale; primele structuri complete ale proteinelor fiind determinate în anii 1950.

Funcționalitatea vastă și variată a proteinelor este în mare măsură legată de forma și structura lor. Proteinele sunt capabile să se plieze în forme și structuri foarte specifice care dictează exact modul în care interacționează cu alte molecule. Luați farmacologia, de exemplu; aproape toate medicamentele determină efectele lor vizând proteinele din corpul uman. Astfel, determinarea structurii proteinelor este o componentă fundamentală a cercetării proteomicii și are aplicații uriașe. Cu toate acestea, cercetarea nu a fost ușoară datorită numărului mare de proteine ​​care există și a numeroaselor forme diferite pe care le pot avea.

De-a lungul anilor, s-au dezvoltat o serie de tehnologii analitice pentru a încerca să rezolve problema, inclusiv cristalografia cu raze X, microscopia crio-electronică și abordările bazate pe spectrometrie de masă. Aceste metode pot fi complexe, costisitoare și un întreg proiect de cercetare – un doctorat de exemplu – poate fi dedicat determinării structurii unei singure proteine.

AlphaFold adoptă inteligența artificială (AI) pentru a prezice și a determina structura și forma unei proteine. Sistemul este capabil să dezvolte o predicție a structurii fizice în câteva zile.

„Am creat un sistem de rețele neuronale bazat pe atenție, care încearcă să interpreteze structura unei proteine. Acesta folosește secvențe și informații legate de evoluție, aliniere de secvențe multiple (MSA) și o reprezentare a perechilor de aminoacizi pentru a rafina acest grafic” – au spus dezvoltatorii AlphaFold.

Profesorul John Moult și profesorul Krzysztof Fidelis au fondat evaluarea critică a predicției structurii proteinelor (CASP) în 1993 pentru a ajuta cercetarea în favoarea predicției structurii proteinelor. CASP selectează structurile de proteine ​​care au fost determinate recent ca ținte pentru grupurile de cercetare cu scopul de a testa acuratețea metodelor lor de predicție. Graficul de notare, cunoscut sub numele de Global Distance Test (GDT), variază de la 0 la 100, unde 90 este de obicei considerat un rezultat „competitiv”. AlphaFold a obținut un scor de 92,4 GDT pentru toate țintele.

„Această lucrare reprezintă un progres uimitor asupra problemei plierii proteinelor, o mare provocare de 50 de ani în biologie. A avut loc cu zeci de ani înainte ca mulți oameni din domeniu să fi prezis, ceea ce va schimba fundamental cercetarea biologică” – profesorul Venki Ramakrishnan, laureat al Premiului Nobel și președinte al Societății Regale, într-un comunicat de presă.

Extinderea frontierelor cunoașterii științifice

Caracterizarea structurii proteinelor SARS-Cov-2, precum și a proteinelor umane cu care interacționează pentru a infecta celulele gazdă, a constituit un accent major de cercetare pentru multe grupuri în ultimele câteva luni. „La începutul acestui an, am prezis mai multe structuri proteice ale virusului SARS-CoV-2, inclusiv ORF3a, ale cărui structuri erau anterior necunoscute” – a spus DeepMind.

Progresul anunțat ne oferă încredere în continuare că AI va deveni unul dintre cele mai utile instrumente ale umanității în extinderea frontierelor cunoașterii științifice.

Mai multe detalii: sursa 1 | sursa 2