Sztuczna Inteligencja lepiej diagnozuje raka piersi niż lekarze. Eksperyment Google

W czasopiśmie ”Nature” opisano badanie przeprowadzone wspólnie przez Google Health, należącą do Google’a firmę Deep Mind (twórcy sztucznej sieci neuronowej), amerykańską uczelnię Northwestern University oraz brytyjski ośrodek badań nad rakiem Cancer Research UK Imperial Centre (CRUK) i tamtejszy szpital państwowy z hrabstwa Surrey.

– Postanowiliśmy sprawdzić, czy sztuczna inteligencja może wspierać radiologów w dokładniejszym analizowaniu wyników badań radiologicznych. W pierwszym podejściu nasz model został przeszkolony i ustawiony do pracy na zbiorze anonimowych danych 76 tys. pacjentek z Wielkiej Brytanii i 15 tys. Amerykanek. Wyniki oceniono na podstawie drugiego zestawu anonimowych danych o 25 tys. Brytyjek i 3 tys. pacjentek z USA – informuje Google w notce prasowej.

Rezultat okazał się obiecujący. Algorytm AI zmniejszył (w stosunku do analizy prowadzonej przez radiologów) o 5,7 proc. liczbę wyników fałszywie pozytywnych, tzw. fałszywych alarmów (gdy błędnie dostrzega się obecność choroby w zdrowym organizmie) wśród pacjentek amerykańskich oraz 1,2 proc. wśród pacjentek brytyjskich.

Sztuczna inteligencja dostarczyła analizę zawierającą o 9,4 proc. mniej wyników fałszywie ujemnych (gdy błędnie uznaje się chory organizm za zdrowy) w wynikach ze Stanów Zjednoczonych i 2,7 proc. w przypadku wyników pacjentek z Wielkiej Brytanii.

– Chcieliśmy sprawdzić do jakiego stopnia stworzony przez nas algorytm jest elastyczny i potrafi pracować na danych z systemu służby zdrowia dowolnego kraju. Dlatego w kolejnym podejściu wyszkoliliśmy model AI na danych z Wielkiej Brytanii by potem analizował on dane z USA. W tym osobnym eksperymencie nastąpiła redukcja wyników fałszywie pozytywnych o 3,5 proc. a fałszywie negatywnych o 8,1 proc. To oznacza, że nasz model komputerowi ma zdolność pracy na nowych zestawach danych przy zachowaniu wydajności wyższej niż żywi eksperci – przekonuje Google.

Algorytm był bardziej wydajny w czytaniu zdjęć rentgenowskich niż każdy z sześciu radiologów biorących udział w teście. Był z kolei równie wydajny co dwóch radiologów czytających ten sam mammogram. O ile np. brytyjskiej publicznej służbie zdrowia właśnie taka forma podwójnej weryfikacji w przypadku pacjentek jest normą, to problemem jest zmęczenie.

Algorytm AI może pracować non stop. Do tego utrzymuje on skuteczność równą dwuosobowemu zespołowi medyków w sytuacji, gdy nie ma dostępu do historii pacjenta i wcześniejszych mammogramów (takie było założenie eksperymentu). Tymczasem w brytyjskich szpitalach na gwałt potrzeba przynajmniej 1000 specjalistów radiologów. Ci obecni są obłożeni pracą i z radością przywitaliby dodatkowe wsparcie ze strony komputerowej sztucznej inteligencji.

Nie ma jednak co liczyć, że AI zastąpi człowieka w szpitalu. W końcu to ludzie napisali algorytm i nauczyli go pracować na określonym zestawie danych. Nie ma też zgody, by zezwolić programowi komputerowemu na samodzielną i ostateczną ocenę zdrowia ludzi.

Jak zauważa BBC, nawet w przypadku dopuszczenia AI do pomocy w diagnostyce, dozór i ostateczny wyrok należałby do człowieka. Nie zmienia to faktu, że algorytm mógłby odciążyć radiologów i pozwolić im na równie ważną pracę na ”innym odcinku”. Wstępna analiza dokonywałaby się w ciągu sekund od przeprowadzenia badania.

– To bardzo obiecujące, choć wczesne wyniki badań. Sugerują one, że w przyszłości możliwe będzie prowadzenie badań przesiewowych dokładniej i szybciej. Oznacza to szybszą obsługę i mniej zmartwień dla pacjenta – uważa Sara Hiom, szefowa pionu diagnostyki w CRUK.

Jan Sochaczewski