luni, 5 iunie 2023

De la specificația funcției la structura proteinei - RFDiffusion: „Do you wanna make a protein?”

 Din ADN spre ARN spre proteine, cu toate funcțiile lor, e un rezumat al dogmei biologice. Deși adevărată, propoziția de mai sus evită un adevăr fascinant - calea e reversibilă!

Un exemplu ceva mai vechi e retrotranscriptaza, o enzimă ce generează ADN pe baza ARN-ului viral, mecanism întâlnit la HIV. Mai nou, din înțelegerea procesului de translație, secvențele ADN și ARN codante pot fi determinate din secvența proteinei. Dacă însă considerăm proteina nu ca un pas final, ci doar ca un promotor al unor evenimente biochimice/biologice, răsare o nouă provocare - e oare posibil a crea proteine noi, cu un comportament predefinit? O asemenea abordare este cunoscută sub numele de design de proteine și implică proiectarea și sinteza de proteine cu structuri și funcții specifice, care nu sunt găsite în natură. Designul de proteine este posibil datorită înțelegerii noastre în continuă dezvoltare a relației între structura proteinelor și funcțiile lor. Prin studierea caracteristicilor structurale ale proteinelor și modului în care acestea interacționează cu alte molecule și medii, cercetătorii pot proiecta proteine cu proprietăți și comportamente dorite. Există mai multe metode și tehnici utilizate în designul de proteine. Unele se bazează pe modificarea proteinelor existente pentru a le conferi noi funcționalități, în timp ce altele implică crearea de proteine complet noi de la zero. Aceste abordări pot utiliza algoritmi de calcul, simulări computerizate, modele structurale și tehnici de inginerie genetică pentru a proiecta și sintetiza proteine cu caracteristici unice. O avansare rapidă în designul de proteine a survenit după apariția algoritmilor de AI, capabile să genereze structuri 3D pe baza structurii primare. AlphaFold, dezvoltat de DeepMind, urmat apoi de RoseTTAFold dezvoltată de Baker's Lab, permit generarea unor structuri 3D foarte apropiate cu structurile stabilite experimental. Algoritmii în cauză permit găsirea rapidă a unor liganzi pentru proteine, crearea de noi biosenzori, precum și generarea de enzime îmbunătățite.

Instrumentul RFDiffusion dezvoltat de Baker's Lab este o nouă abordare în designul de proteine. Acesta utilizează o rețea neurală cu două componente principale: un Encoder și un Decoder, similare cu cele folosite în generarea de imagini.

Encoder-ul are rolul de a transforma o structură proteică tridimensională într-o formă de prompt specificată de utilizator. Aceasta poate fi o descriere textuală, un set de constrângeri sau alte indicații specifice privind structura și funcția proteinelor dorite. Encoder-ul codifică informația structurală a proteinei într-o reprezentare latentă, care este apoi transmisă către Decoder.

Decoder-ul preia reprezentarea latentă și încearcă să reconstruiască structura 3D a proteinelor pe baza prompt-urilor specifice furnizate de utilizator. Acesta efectuează operația inversă a Encoder-ului și generează o catenă proteică cu caracteristicile și funcțiile dorite.

Prin utilizarea prompt-urilor specificate de utilizator, Decoder-ul poate fi ghidat să genereze proteine cu anumite proprietăți sau comportamente predefinite. Aceasta deschide noi posibilități în designul de proteine și permite crearea de proteine personalizate în funcție de nevoile și cerințele specifice.

Introducerea zgomotului informațional în procesul de decodare permite explorarea unui spațiu mai larg de soluții și generarea de variații ale structurilor proteice. Prin adăugarea unui nivel controlat de nesiguranță și fluctuație în procesul de decodare, se obțin proteine cu caracteristici unice și diferite față de cele antrenate anterior.
Această abordare iterativă, care implică repetarea etapei de decodare cu zgomot informațional, permite obținerea unei diversități mai mari de structuri proteice, ceea ce poate fi benefic în explorarea spațiului proteic și identificarea unor soluții mai eficiente sau inovatoare pentru diferite aplicații.
Astfel, Bioinformatica Structurală vine cu soluții bazate pe AI,gata să dea un nou impuls medicinei și tehnologiei. În acest sens, algoritmii precum RFDiffusion sunt similari cu celebrul ChatGPT(utilizat de altfel inclusiv la generarea acestui text). Pe baza unor prompturi de la utilizator, ghidat, se pot obține noi secvențe(texte), cu noi funcțiuni, cu mult mai simplu și rapid. Ulterior, rămâne doar ca rezultatele să fie verificate și validate.
Autor: Victor Baerle, Bioinformatică, UVT
Articol accesat ultima dată la 05.06.2023:

Niciun comentariu:

Trimiteți un comentariu

On deep-learning tools used in protein-peptide residues identification...and on how AI approaches permeate structural bioinformatics

  Using CNNs to predict peptide-protein binding interfaces: PepCNN deep learning tool for predicting peptide binding residues in...