Earth BioGenome Project wystartował w 2018 r. z niezwykle ambitnym celem – do 2028 r. zsekwencjonować genomy wszystkich 1,85 miliona znanych gatunków eukariotycznych. Koszt tego przedsięwzięcia szacuje się na blisko 5 mld dol., co niektórzy porównują do lotu na Księżyc w dziedzinie biologii. Jednak tradycyjne metody sekwencjonowania okazują się zbyt powolne, by nadążyć za tempem wymierania. Tu właśnie pojawia się nieoczekiwany sojusznik – sztuczna inteligencja opracowana przez Google.
Czytaj też: Genom to za mało, poznaj pangenom! Coraz bliżej przełomu?
Do listopada 2025 roku projekt zgromadził dane dla 4386 gatunków. Choć brzmi to imponująco, stanowi zaledwie ułamek procenta ostatecznego celu. W inicjatywie uczestniczy ponad 60 globalnych programów badawczych współpracujących przy tworzeniu kompletnego katalogu genomów organizmów eukariotycznych, od mikroskopijnych grzybów po wieloryby.
Warto zrozumieć, z jakim wyzwaniem mierzą się naukowcy. Każdy genom to sekwencja miliardów nukleotydów – zasad A, T, G i C – zawierających wszystkie informacje potrzebne do funkcjonowania organizmu. Dla porównania, ludzki genom liczy około 3 mld takich zasad, a jego pierwsze odczytanie zajęło dekadę i kosztowało 3 mld dol. w 2003 r. Dziś ten sam proces można przeprowadzić w ciągu dnia za ok. 1000 dol.
Czy uda się zsekwencjonować genomy wszystkich gatunków na Ziemi?
Postęp technologiczny daje nadzieję, że sekwencjonowanie wszystkich znanych gatunków oraz odkrycie pozostałych 80-90 proc. wciąż nieznanych nauce jest w zasięgu możliwości. Niestety, czas działa na niekorzyść badaczy – każdego dnia ginie średnio kilkadziesiąt gatunków, zanim zdążymy poznać ich genetyczną historię. W tym kontekście narzędzia opracowane przez Google Research mogą okazać się przełomowe. DeepVariant przekształca problem sekwencjonowania w zadanie klasyfikacji obrazów, analizując wizualizacje wyrównanych odczytów DNA i wykorzystując głębokie sieci neuronowe do rozróżniania prawdziwych wariantów genetycznych od błędów instrumentów pomiarowych.
Czytaj też: Naukowcy podglądający ludzki genom mają nową “zabawkę”. Rozdzielczość nawet 100 razy wyższa!
Wyniki są rzeczywiście zachęcające – DeepVariant zdobył nagrodę za najwyższą dokładność w konkursie precisionFDA Truth Challenge, przewyższając najnowocześniejsze metody klasyczne. Od 2017 r. wskaźnik błędów tego narzędzia zmniejszył się o ponad połowę, co przekłada się na znacznie bardziej wiarygodne dane genetyczne. W 2025 r. dołączył do niego DeepPolisher, wykorzystujący architekturę Transformer znaną z dużych modeli językowych. To narzędzie redukuje błędy w składaniu genomów o 50 proc., a błędy insercji i delecji o 70 proc., co ma kluczowe znaczenie, ponieważ wstawione lub usunięte zasady mogą przesunąć ramkę odczytu genu, powodując jego pominięcie podczas analizy.
Human Pangenome Reference Consortium wykorzystał DeepPolisher w maju 2025 r. do drugiego wydania swoich danych, poprawiając jakość składania genomu z Q66.7 do Q70.1. Osiągnięto poziom mniej niż jednego błędu na pół miliona zsekwencjonowanych zasad, co otwiera możliwości precyzyjnej medycyny i skuteczniejszych działań ochronnych. Oba narzędzia dostępne są jako oprogramowanie open source, umożliwiając naukowcom na całym świecie korzystanie z nich bez dodatkowych kosztów licencyjnych.
Praktyczną wartość dokładnych danych genomicznych doskonale ilustruje przykład kākāpō – nielotnej papugi z Nowej Zelandii, która może osiągać największe rozmiary wśród wszystkich papug i dożywać stu lat. W 2015 r. na wolności żyło zaledwie 49 osobników tego gatunku. Dane genomiczne każdego żyjącego ptaka pozwoliły ekologom zidentyfikować obszary największej różnorodności genetycznej, co było kluczowe dla uniknięcia problemów chowu wsobnego. Przeniesienie wybranych ptaków w obrębie ich siedlisk pomogło zwiększyć populację do ponad 250 osobników w ciągu kilku pokoleń.
Ten sukces pokazuje, jak narzędzia AI opracowane przez Google Research mogą przyspieszać nie tylko samo sekwencjonowanie, ale także identyfikację wariantów genów związanych z chorobami czy odpornością. Earth BioGenome Project ma stworzyć podobne możliwości dla wszystkich gatunków na Ziemi. W erze szóstego wielkiego wymierania, którego jesteśmy świadkami, precyzyjne dane genetyczne mogą stanowić różnicę między całkowitą utratą bioróżnorodności a jej zachowaniem dla przyszłych pokoleń. Choć sztuczna inteligencja nie rozwiąże sama problemu wymierania gatunków, daje naukowcom potężne narzędzia do bardziej skutecznego działania w tym wyścigu z czasem. Aktualny stan zaawansowania projektu można śledzić na specjalnej platformie, która dokumentuje postępy w sekwencjonowaniu kolejnych gatunków.
