Hlboké učenie (Deep learning) radikálne zmenilo oblasť umelej inteligencie (AI). V súčasnosti neurónové siete revolučne menia spôsob, akým objavujeme nové lieky. Podľa Francesci Grisoni, odbornej asistentky na oddelení biomedicínskeho inžinierstva na TU Eindhoven, ktorá stojí na čele výskumu automatizácie navrhovania liekov: „Na konci chceme zvýšiť ľudskú inteligenciu pri vývoji nových liekov.“
Začnime od začiatku. Ako všetci vieme, vývoj liekov je veľmi namáhavý proces. Odhadovaný počet molekúl, ktoré by mohli byť použité ako východiskové body pre objavovanie liečiv, sa odhaduje na rádovo 1060 – 10 100, čo je oveľa viac, ako je hviezd v pozorovateľnom vesmíre. Nájdenie molekuly liečiva, ktorá má požadované vlastnosti, je ako nájsť ihlu v kope sena.
Ako vysvetlila Grisoni: „Okrem iného je väčšina molekúl liečiva navrhnutá tak, aby modulovala špecifické cieľové proteíny v našich bunkách. Interakciou s týmito cieľmi môže liek inhibovať alebo podporovať aktivitu tohto proteínu. Tento efekt, známy ako bioaktivita, je možné využiť na liečbu alebo prevenciu chorôb.“
Ako ďalej dodala Grisoni: „Ústrednou myšlienkou navrhovania liekov je, že chcete identifikovať molekuly, ktoré sú vysoko aktívne voči zamýšľaným cieľom, a nie voči iným cieľom, ktoré by mohli spôsobiť nežiaduce vedľajšie účinky. Vzhľadom na veľký počet možných molekúl, ktoré by bolo možné zvážiť pri navigácii tento „chemický priestor“ je efektívne extrémne náročný.”
A tým to nekončí. Akonáhle nájdete potenciálnu kandidátsku molekulu liečiva (alebo zlúčeninu), musíte ju ešte vyrobiť v laboratóriu (proces známy ako chemická syntéza) a testovať ju v stále komplexnejších experimentoch. To je nielen veľmi časovo náročné (veľa molekúl je šialených), ale aj veľmi drahé. Je to jeden z dôvodov, prečo veľká farmaceutika tak žiarlivo stráži svoje ťažko vydobyté patenty.
Počítačová pomoc v objave liekov
Nie je preto prekvapením, že pred 30 rokmi sa lekárski chemici a biológovia obrátili na počítače, aby im pomohli urýchliť proces objavovania a vývoja liekov. Ako vysvetlila Grisoni: „Počítače môžu pomôcť pri výbere molekúl, ktoré sú teraz pravdepodobne účinné na zamýšľaný účel a sú syntetizovateľné.“
„Jedným zo spôsobov, ako sa s týmto problémom vyrovnať, je to, čo nazývame virtuálny skríning, kde pomocou výpočtových metód vyberáte kandidátov na testovanie z knižnice molekúl, o ktorých viete, že ich je možné syntetizovať.“ Tieto knižnice sú oveľa menšie ako celý chemický vesmír (zvyčajne obsahuje 103 až 106 molekúl), takže sa v nich dá jednoduchšie orientovať. V niektorých prípadoch by však niekto mohol chcieť preskúmať rôzne oblasti chemického priestoru, ktoré nie sú zahrnuté v takýchto virtuálnych skríningových knižniciach.“
Tu môže prísť na záchranu dizajn „de novo“, kde navrhujete molekuly „od začiatku“. “De novo design má ďalšiu výhodu v tom, že môžete vytvárať molekuly zamerané na ciele, ktoré chcete dosiahnuť, dúfajme, že aj na tie, na ktoré zatiaľ nikto iný nepomyslel.”
Od dizajnu až k hlbokému učeniu
Ako však vybudujeme takéto molekuly od začiatku? Tradične sa to robilo dodržiavaním špecifického súboru pravidiel. „Zamyslite sa nad tým, ako funguje gramatika v jazyku. Ak dáte dohromady veľa slov, nedostanete vetu, ktorá dáva zmysel. Potrebujete teda pravidlá. Podobne môžete prísť s pravidlami, ako zostaviť atómy alebo molekulárne fragmenty dohromady do zlúčeniny, ktorá dáva nielen chemický zmysel, ale má aj požadované biologické vlastnosti.“
Ale rovnako ako počítačoví lingvisti, ktorí sa v 80. a 90. rokoch 20. storočia neúspešne pokúsili automatizovať preklad tým, že prišli s knihou pravidiel, prístup založený na pravidlách v medicíne môže narážať na svoje hranice.
Odvodenie SMILESOVEJ reprezentácie chemickej molekuly
Ako uviedla Grisoni: „V špecifických prípadoch si čoskoro uvedomíte, že pravidlá sú príliš obmedzujúce alebo príliš zložité.“ Práve tu prichádza na pomoc strojové učenie, presnejšie hlboké učenie. Umožnilo počítačovým návrhárom liekov, ako je Grisoni, automaticky sa naučiť nielen „gramatiku“ známych zlúčenín (aké prvky sú potrebné na vytvorenie platnej molekuly, ktorú je možné syntetizovať?), Ale aj jej „sémantiku“ (aké prvky sú potrebné na dosiahnutie požadovanej biologickej aktivity na daný cieľ?).
Výroba molekúl
Aby to všetko dosiahli, vedci používajú modely hlbokého učenia požičané zo spracovania prirodzeného jazyka (Natural Language Processing), kde AI tiež priniesla revolúciu do sveta automatického prekladu a rozpoznávania reči (prináša nám také neprehliadnuteľné aplikácie ako Google Translate a Siri). Aby bolo možné použiť NLP pri navrhovaní liečiv, musela byť štruktúra molekúl najskôr vyjadrená ako reťazec slov.
Našťastie je takýto jazyk k dispozícii od osemdesiatych rokov: SMILES (simplified molecular-input line-entry system). Ako vysvetlila Grisoni: „Pridaním jedného znaku naraz na dokončenie reťazca SMILES je model NLP schopný automaticky generovať nové molekuly. Tento proces nie je náhodný. Nové postavy sú vyberané na základe toho, čo sa model naučil z predtým dostupných údajov. V porovnaní s vyhľadávaním Google, ktoré automaticky dokončí zadanie vášho vyhľadávania na základe predchádzajúcich dotazov.“
Na rozdiel od Vyhľadávania Google alebo Prekladača však Grisoni a jej kolegovia čelia zložitému problému, ktorý je špecifický pre svet navrhovania liekov: nedostatok veľkých školiacich údajov o počítačových algoritmoch predtým, ako sa dajú použiť na generovanie nových molekúl. Ako vysvetlila Grisoni: „Veľké súbory údajov pre hlboké vzdelávanie v oblasti navrhovania liekov sú veľmi vzácne. V niektorých prípadoch môžete mať iba niekoľko zlúčenín, o ktorých je známe, že pôsobia na daný cieľ.“
Práca s dátami
Bola to jedna z výziev, s ktorými sa musela vyrovnať v súvislosti s výskumným článkom o generatívnej umelej inteligencii, ktorý napísala spolu s bývalými kolegami z ETH Zürich a bol nedávno publikovaný v časopise Science Advances. V príspevku vedci najskôr kombinujú prístup „bez pravidiel“ hlbokého učenia sa na generovanie bioaktívnych molekúl so syntézou na čipe, formou miniaturizovanej automatizovanej syntézy, ktorá ďalej minimalizuje množstvo potrebnej ručnej práce.
Na vyriešenie problému s malými údajmi použili vedci metódu nazývanú prenosové učenie.
„Základnou myšlienkou je, že využijete údaje, ktoré nejakým spôsobom súvisia s vašim problémom, ale pre ktoré môže byť k dispozícii mnoho ďalších príkladov, aj keď to nie sú práve údaje, ktoré potrebujete. Myslite na to, keď niekto prvýkrát napíše vedecký článok. Možno predtým prečítali 50 podobných dokumentov a potom sú už schopní začať písať svoje. Ale, samozrejme, nezačínali od nuly, celý život sa učili čítať a písať.“
„Podobne predtrénujeme naše modely hlbokého učenia na desaťtisícoch molekúl, ktoré majú všeobecné vlastnosti zaujímavé pre náš cieľ. Akonáhle sa modely dozvedia dostatočné informácie, „upresníme“ ich v konkrétnejšom súbore zameranom na to, čo chceme dosiahnuť, ako je napríklad aktivita v určitom cieľovom proteíne. A ukázalo sa, že to funguje pri viacerých príležitostiach, pričom sady v druhej fáze výcviku sú malé ako päť molekúl! V článku Science Advances sme použili 40.“
Prijatie lepších rozhodnutí
Nakoniec sa Grisoni a jej kolegom podarilo identifikovať 12 nových bioaktívnych zlúčenín pre takzvané pečeňové X receptory, ktoré sa ukázali ako sľubné ciele liekov kvôli ich regulačnej úlohe v metabolizme lipidov a zápaloch.
Samozrejme, ako to vždy v prípade inovatívneho výskumu býva, stále je pred nami dlhá cesta. Chemický priestor v experimente bol napríklad obmedzený na 17 jednokrokových reakcií, aby sa zaistilo, že zlúčeniny sú kompatibilné s experimentmi na čipe. Grisoni tiež poukazuje na to, že štrukturálna rozmanitosť nových bioaktívnych zlúčenín je stále dosť obmedzená a môže vyžadovať ďalšie rozšírenie.
Napriek tomu je výskumníčka pôvodom z Talianska s výsledkami celkom spokojná. Ako dodala na záver Grisoni: „Naša štúdia je priekopníkom integrácie modelov AI “chemického jazyka” pre molekulárny dizajn s automatizovanou syntézou do miniaturizovaného systému. Čelíme nevídaným príležitostiam, ktoré prináša nová technológia AI a interdisciplinárna spolupráca v oblasti molekulárneho dizajnu a syntézy, objavovania liekov a ďalších oblastí. Prístupy, ako sú naše, budú v budúcnosti podporovať lekárskych chemikov, aby sa „lepšie rozhodovali rýchlejšie“.
Zdroj: https://sciencebusiness.net; https://www.tue.nl, zverejnené: 17. 9. 2021, autor: rpa