Firma Google DeepMind udostępniła ulepszoną wersję narzędzia AlphaFold, które potrafi przewidzieć strukturę nie tylko białek, ale prawie wszystkich cząsteczek życia. Jest to ogromne osiągnięcie, które może pomóc przyspieszyć odkrywanie nowych leków i inne badania naukowe.
Czytaj też: Sztuczna inteligencja będzie czytać w naszych myślach. Wystarczy specjalny czepek
Poprzedni model, wydany w 2020 r., zadziwił społeczność naukową umiejętnością przewidywania fałdowania białek, który jest tajemnicą od ponad 50 lat. Najnowsza wersja – AlphaFold 3 – może przewidywać nie tylko strukturę białek, ale także DNA, RNA i cząsteczek takich, jak ligandy, które są niezbędne do tworzenia nowych leków. Narzędzie to zapewnia bardziej szczegółowy i dynamiczny portret interakcji biologicznych niż cokolwiek, co istniało wcześniej. Szczegóły opisano w Nature.
Sztuczna inteligencja Google coraz lepsza
AlphaFold 2 pomógł nam lepiej odwzorować ludzkie serce, modelować oporność na środki przeciwdrobnoustrojowe i identyfikować jaja wymarłych ptaków, ale AlphaFold 3 może przebić go na każdej płaszczyźnie. To, do czego zdolny jest już teraz, nie mieści się w głowie.
Czytaj też: Sztuczna inteligencja dokończy to, co zaczęła Najwyższa Prawda. Nowe zagrożenie na horyzoncie
Mohammed AlQuraishi, adiunkt biologii systemowej na Columbia University, niezwiązany z DeepMind, uważa, że nowa wersja modelu będzie jeszcze lepsza w odkrywaniu leków:
System AlphaFold 2 wiedział tylko o aminokwasach, więc miał bardzo ograniczone zastosowanie dla biofarmacji, ale teraz może w zasadzie przewidzieć, gdzie lek wiąże się z białkiem.
Isomorphic Labs, oddział DeepMind zajmujący się odkrywaniem leków, już korzysta z AlphaFold 3, choć ma swoje ograniczenia. W niektórych zastosowaniach AlphaFold 3 ma dwukrotnie większą skuteczność niż podobne, wiodące modele, np. RoseTTAFold, ale w przypadku innych, takich jak interakcje białko-RNA, narzędzie nadal jest bardzo niedokładne.
W zależności od modelowanej interakcji dokładność może wynosić od 40 proc. do ponad 80 proc. System sam powie naukowcom, na ile jest pewny swoich przewidywań. W przypadku mniej dokładnych prognoz, badacze wykorzystają AlphaFold 3 jedynie jako punkt wyjścia pozwalający na użycie innych metod. Dopiero kolejnym krokiem jest sięgnięcie po techniki eksperymentalne, jak krystalografię rentgenowską.
Jak łatwo się domyślić, większa biblioteka cząsteczek AlphaFold 3 i wyższy poziom złożoności wymagały ulepszeń podstawowej architektury. Dlatego DeepMind zwrócił się w stronę modeli dyfuzyjnych, które badacze sztucznej inteligencji stale udoskonalają w ostatnich latach i obecnie zasilają generatory obrazów i wideo, takie jak DALL-E 2 i Sora OpenAI. To z kolei oznaczało dużą ewolucję w stosunku do poprzedniego modelu i uproszczenie całego procesu prognostycznego.
Ale zastosowanie modeli dyfuzyjnych umożliwiło AlphaFold 3 halucynacje, czyli struktury, które wyglądają wiarygodnie, ale w rzeczywistości nie mogą istnieć. Naukowcy dodali więcej danych do obszarów najbardziej podatnych na halucynacje, choć nie rozwiązało to całkowicie problemu.
Co dalej? W przypadku AlphaFold 2 firma udostępniła kod open source, umożliwiający badaczom zajrzenie “pod maskę” modelu. Był on również dostępny do wszelkich celów, w tym do użytku komercyjnego przez producentów leków. W przypadku AlphaFold 3 nie ma obecnie planów wydania pełnego kodu. Zamiast tego firma udostępnia publiczny interfejs dla modelu o nazwie AlphaFold Server, który nakłada ograniczenia na cząsteczki, z którymi można eksperymentować i których można używać tylko do celów niekomercyjnych.