Ang isa sa mga pangunahing gawain ng biology ay nalutas

Ang isa sa mga pangunahing gawain ng biology ay nalutas
Ang isa sa mga pangunahing gawain ng biology ay nalutas
Anonim

Ang istraktura ng protina ay isa sa mga pangunahing misteryo na kailangang tuklasin ng agham, halimbawa, para sa pag-recycle ng basurang plastik o paggamot sa mga sakit na namamana. Ngunit lumabas na ang kalikasan ay mas tuso kaysa sa anumang computer: mayroong higit sa 200 milyong mga istraktura ng protina sa mundo, at ang bawat isa ay indibidwal. Ang artipisyal na intelektuwal (AI) ay nagdala ng mga siyentista na malapit sa paglutas ng kanilang mga lihim.

Nalutas ng artipisyal na katalinuhan (AI) ang isa sa pinakamahalagang problema sa biology: ngayon ay maaari itong magamit upang hulaan ang pagkakasunud-sunod ng amino acid ng three-dimensional na istraktura ng isang protina. Nakasalalay sa pagiging perpekto o di-kasakdalan ng pagkakasunud-sunod na ito, ginagawa ng protina ang mga pagpapaandar nito. Ang nangungunang mga dalubhasa sa istruktura biology at ang mga tagapag-ayos ng eksperimento ng biennial natitiklop na (natitiklop) na eksperimento ngayon ay inihayag ang natitirang tagumpay na ito ng mga siyentipiko mula sa British company na DeepMind, na bumubuo sa larangan ng artipisyal na intelektuwal (AI). Nasabi na ang pamamaraan ng DeepMind ay magkakaroon ng malalawak na implikasyon. Halimbawa, maaari nitong mapabilis ang pagbuo ng mga bagong gamot.

"Ang pangkat ng DeepMind ay nakamit ang isang kamangha-manghang resulta na dramatikong magbabago ng mga prospect para sa pagpapaunlad ng istrukturang biology at pananaliksik sa protina," sabi ni Janet Thornton, director emeritus ng European Bioinformatics Institute. "Ang hamon na ito ay 50 taong gulang," idinagdag ni John Moult, isang estruktural biologist sa University of Maryland sa Shady Grove; Si Moult ay isang co-founder ng Kritikal na Pagsusuri ng Protein Structure Prediction (CASP) na kumpetisyon sa agham. "Hindi ko inakalang mabubuhay ako upang makita ang sandaling ito," dagdag ni Moult.

Tungkol Saan yan? Sa katawan ng tao, mayroong libu-libong iba't ibang mga protina, na ang bawat isa ay isang kadena ng maraming mga amino acid - mula sa sampu hanggang sa daan-daang. Tinutukoy ng pagkakasunud-sunod ng mga amino acid ang hindi mabilang na bilang ng mga pakikipag-ugnayan sa pagitan nila at, sa gayon, ay humantong sa paglitaw ng mga kumplikadong three-dimensional na istraktura, na kung saan, natutukoy ang mga katangian ng mga protina. Ang impormasyon tungkol sa mga istrukturang ito ng protina ay nagbibigay-daan sa mga siyentista na lumikha ng mga bagong gamot. At ang kakayahang mag-synthesize ng mga protina na may nais na istraktura ay magpapabilis sa pag-unlad ng mga enzyme (accelerator), sa tulong nito, halimbawa, posible na makagawa ng biofuels at ganap na mabulok ang basurang plastik.

Sa loob ng mga dekada, nai-decipher ng mga siyentista ang mga istrukturang protina ng three-dimensional na gumagamit ng mga pang-eksperimentong diskarte tulad ng X-ray crystallography o cryoelectron microscopy (cryo-EM). Gayunpaman, ang paggamit ng mga nasabing pamamaraan ay tumatagal, sa mga oras, buwan o taon; bukod dito, ang mga pamamaraang ito ay hindi laging gumagana. Sa higit sa 200 milyong kilalang mga istrukturang protina, halos 170 libo lamang ang na-decipher.

Noong 1960s, napagpasyahan ng mga siyentista na kung posible upang matukoy ang lahat ng mga koneksyon na katangian ng isang naibigay na pagkakasunud-sunod ng protina, posible posible na hulaan ang spatial na istraktura ng protina. Gayunpaman, dahil ang bawat protina ay naglalaman ng daan-daang mga yunit ng amino acid na nakikipag-ugnay sa bawat isa sa iba't ibang paraan, sa huli nalaman namin na ang kabuuang posibleng bilang ng mga naturang istraktura bawat isang pagkakasunud-sunod ng amino acid ay napakalaki. Kinuha ng mga syentista ng computer ang solusyon sa problemang ito, ngunit ang mga bagay ay dahan-dahan.

Noong 1994, naglunsad si John Moult at ang kanyang mga kasamahan ng isang malakihang eksperimento sa CASP, na isinasagawa tuwing dalawang taon. Ang mga kalahok sa eksperimentong ito ay binibigyan ng mga pagkakasunud-sunod ng amino acid na halos isang daang mga protina, na ang istraktura ay hindi alam. Ang ilang mga pangkat ng siyentipiko ay kinakalkula ang istraktura para sa bawat pagkakasunud-sunod, habang ang iba pang mga pangkat ay tinutukoy ito sa eksperimento. Pagkatapos ihambing ng mga tagapag-ayos ng eksperimento ang hinulaang mga hula sa mga resulta sa laboratoryo gamit ang isang pagtatantya ng kawastuhan ng pagtatantya (GDT), na mula sa zero hanggang isang daan. Sa mga pagtatantya sa itaas ng 90 GDT, ang kinakalkula na mga hula ay itinuturing na malapit sa mga pang-eksperimentong sinabi, sinabi ni Moult.

Nasa 1994 pa, nakamit ng mga siyentista na ang mga istraktura ng maliliit na simpleng protina na hinulaang ng mga ito ay maaaring tumutugma sa mga pang-eksperimentong resulta. Gayunpaman, para sa mas malaki at mas kumplikadong mga protina, ang mga resulta sa pagkalkula ay halos 20 GDTs - isang "kumpletong pagkabigo," bilang isa sa mga hukom ng CASP, si Andrei Lupas, isang evolutionary biologist sa Institute of Developmental Biology, inilagay ito. Max Planck. Pagsapit ng 2016, ang mga koponan ng siyentipikong nakikipagkumpitensya ay nagrekrut ng halos 40 GDTs para sa pinaka-kumplikadong mga protina, pangunahin sa pamamagitan ng pagsusuri ng mga kilalang istrukturang protina na kilala sa CASP.

Nang ipasok ng DeepMind ang kumpetisyon sa kauna-unahang pagkakataon sa 2018, ang iminungkahing algorithm na tinatawag na AlphaFold ay umasa sa pamamaraang inilarawan sa itaas para sa paghahambing ng mga teoretikal at praktikal na resulta. Ngunit gumagamit din ang AlphaFold ng mga malalim na pamamaraan ng pag-aaral: natututo ang software mula sa napakaraming data (sa kasong ito, mga pagkakasunud-sunod at istraktura ng mga kilalang protina) at natututunan upang makilala ang mga pattern. Madaling nanalo ang DeepMind, tinalo ang kumpetisyon ng average na 15% para sa bawat istraktura ng protina at pagmamarka ng halos 60 GDT na puntos para sa pinaka-mapaghamong gawain.

Gayunpaman, ayon kay John Jumper, na responsable para sa pagbuo ng AlphaFold algorithm sa DeepMind, ang mga hula na ginawa ay masyadong krudo upang magamit para sa mga praktikal na layunin. "Alam namin na malayo pa rin kami mula sa praktikal na paggamit sa biology," sabi ni Jumper. Upang makamit ang mas mahusay na mga resulta, pinagsama ni Jumper at ng kanyang mga kasamahan ang malalim na pag-aaral sa isang "algorithm ng pansin" na gumagaya sa kakayahan ng tao na tipunin ang mga jigsaw puzzle. Narito kung paano ito nangyayari: una, maliit na mga fragment ay ginawa mula sa maliliit na piraso (sa kasong ito, mga fragment ng mga amino acid unit), at pagkatapos ay susubukan na pagsamahin ang mga fragment na ito, na bumubuo ng isang solong buong mas malalaking sukat. Ang gawaing ito ay nagsasangkot ng isang computer network na binubuo ng 128 machine processors ng pag-aaral; nagawa nilang sanayin ang algorithm sa halos 170 libong kilalang mga istruktura ng protina.

At nagtrabaho ito! Sa taong ito, ang AlphaFold algorithm ay nakatanggap ng isang average na marka ng 92.4 GDT para sa mga protina na iminungkahi para sa pagtatasa sa CASP. Kapag pinag-aaralan ang pinaka-kumplikadong mga protina, ang algorithm ng AlphaFold ay nakakuha ng average na 87 puntos, na mas mataas ng 25 puntos kaysa sa pinaka tumpak na mga hula na nagawa kanina. Nakaya pa ng algorithm ang pagtatasa ng mga istraktura ng mga protina na matatagpuan sa mga lamad ng cell at responsable para sa maraming sakit ng tao, gayunpaman, sa parehong oras, mahirap pag-aralan ang paggamit ng X-ray crystallography. Ang struktural biologist na si Venki Ramakrishnan ng Molecular Biology Laboratory ng Medical Research Council ay tinawag ang resulta na "isang nakamamanghang tagumpay sa problema ng paghula ng istraktura ng protina."

Ayon kay John Moult, sa kumpetisyon ngayong taon, lahat ng mga pangkat ng mga siyentista ay nagpakita ng mas tumpak na mga resulta. Ngunit kung pag-uusapan natin ang tungkol sa AlphaFold algorithm, kung gayon ayon kay Andrey Lupas, "ang sitwasyon ay nagbago nang radikal." Ang mga tagapag-ayos ng eksperimento ng CASP ay nag-alinlangan pa rin sa integridad ng DeepMind algorithm. At itinakda ni Lupas ang kanyang sarili ng isang hiwalay na gawain: upang malaman ang istraktura ng protina ng lamad ng species ng archaea (isang kinatawan ng isang pangkat ng mga sinaunang mikroorganismo). Sa loob ng sampung taon, sinusubukan ng kanyang pangkat ng pagsasaliksik na makakuha ng isang X-ray ng istrakturang kristal ng protina na ito. Ngunit, ayon kay Lupas, hindi malulutas ang problemang ito.

Gayunpaman, ang AlphaFold algorithm ay walang anumang mga problema. Ang output ay isang detalyadong imahe ng isang tatlong-sangkap na protina na may dalawang helical na sanga sa gitna. Pinapayagan ng modelo na ginawa ng algorithm na maunawaan ni Lupas at ng kanyang mga kasamahan ang nakuha na data gamit ang X-ray; sa kalahating oras, inihambing nila ang kanilang pang-eksperimentong data sa istrakturang hinulaang ng AlphaFold algorithm. "Ang resulta ay halos perpekto," sabi ni Lupas. - Imposibleng manipulahin ang data. Hindi ko maintindihan kung paano nila ito nagawa."

Ang isa sa mga kundisyon para sa paglahok sa eksperimento sa CASP, ang DeepMind, kasama ang lahat ng iba pang mga pangkat, ay sumang-ayon na ibunyag ang mahahalagang detalye ng kanilang pamamaraan upang maulit ito ng ibang mga pangkat. Regalo ito para sa mga eksperimento, dahil ang tumpak na hula ng istraktura ng protina ay makakatulong sa kanila na wastong bigyang kahulugan ang nakakubli na data na nakuha gamit ang mga pag-aaral ng X-ray at cryo-electron microscopy (cryo-EM). Bilang karagdagan, ang AlphaFold algorithm, ayon sa Moult, ay papayagan din ang mga developer ng gamot na mabilis na matukoy ang istraktura ng mga protina na bumubuo ng bago at mapanganib na mga pathogens, tulad ng SARS-CoV-2, na kung saan ay dapat isaalang-alang bilang isa sa ang mahahalagang hakbang sa proseso ng paghahanap ng mga molekula kung saan maaaring ma-block ang mga pathogens na ito.

Gayunpaman, ang AlphaFold algorithm ay hindi kaya ng lahat ng mga gawain. Halimbawa, sa eksperimento sa CASP, ang gawain nito ay kapansin-pansin na bumagal kapag pinag-aaralan ang isa sa mga protina (ito ay isang halo ng 52 maliit na paulit-ulit na mga segment na nagpapangit ng mga lokasyon ng bawat isa sa panahon ng pagpupulong). Sinabi ni John Jumper na nais ng pangkat ng pananaliksik na sanayin ang AlphaFold upang masuri nito ang mga istrukturang nabanggit sa itaas, pati na rin ang mga kumplikadong protina na magkakasamang gumaganap ng mahahalagang pag-andar sa selyula.

Gayunpaman, kaagad pagkatapos malutas ang isa sa pinakamahirap na problema, ang iba ay walang alinlangan na lilitaw. "Hindi pa ito tapos," sabi ni Janet Thornton. "Maraming mga bagong gawain na nauna sa atin."

Inirerekumendang: