A wszystko wskazuje na to, że sztuczna inteligencja z biegiem czasu staje się podatna na objawy przywodzące na myśl demencję. To z kolei rodzi obawy o jej niezawodność, ponieważ pogorszenie funkcji poznawczych może mieć znaczący wpływ na to, jak przydatne i skuteczne są stosowane przez nas narzędzia.
Czytaj też: Sztuczna inteligencja staje się coraz groźniejsza. Ostatnie wydarzenia są wyjątkowo przerażające
Artykuł dotyczący przewidywań z zakresu dalszej przyszłości sztucznej inteligencji został zamieszczony na łamach The BMJ. Analizy poświęcone różnym wersjom tzw. chatbotów, które są obecnie wyjątkowo popularne, doprowadziły ich autorów do bardzo interesujących wniosków. Takie narzędzia wypadają bowiem gorzej wraz z upływem czasu, na podobnej zasadzie jak starsi pacjenci wykonujący testy funkcji poznawczych.
Na potrzeby zorganizowanych badań naukowcy opracowali eksperyment mające na celu ocenę zdolności poznawczych publicznie dostępnych dużych modeli językowych. Badania te miały dotyczyć narzędzi w postaci ChatGPT (wersje 4 i 4o) Claude 3.5 „Sonnet” oraz Gemini w wersji 1 i 1.5. Ocena miała nastąpić z wykorzystaniem testu MoCA (Montreal Cognitive Assessment).
Sztuczna inteligencja najwyraźniej ma problemy z pogorszeniem funkcji poznawczych wraz z upływem czasu. Można to porównać do demencji występującej u ludzi
Ten jest zwykle stosowany w przypadku ludzi i ma na celu identyfikację upośledzenia funkcji poznawczych oraz wczesnych objawów demencji. Ma on postać prostych zadań i krótkich pytań, na podstawie których ocenia się zdolności, takie jak uwaga, pamięć, język, umiejętności wzrokowo-przestrzenne czy funkcje wykonawcze. Maksymalny możliwy do uzyskania wynik to 30 punktów, natomiast rezultat na poziomie 26 lub wyższy można uznać za normalny.
ChatGPT 4o uzyskał najwyższy wynik (26 na 30). Kolejne miejsce przypadło ChatGPT 4 i Claude (25 na 30) oraz Gemini 1.0 otrzymał zaledwie 16 na 30 punktów. W przypadku każdego z uczestników zdecydowanie wyróżniały się ograniczenia dotyczące funkcji wzrokowo-przestrzennych oraz zadań polegających na wykonywaniu zadań pokroju wskazywania godzin na tarczy zegara.
Czytaj też: Niezwykłe odkrycie podważa supremację kwantową. Zwykły komputer pokonał kwantowego rywala!
O ile w wielu innych kategoria sztuczna inteligencja wypadała dobrze, tak testy wizualno-przestrzenne zdecydowanie dawały im się we znaki. Miały też problemy z wykazywaniem empatii oraz interpretacją złożonych scen wizualnych. Jak zauważają sami zainteresowani, odnotowane trudności w realizacji zadań wymagających abstrakcji wizualnej i funkcji wykonawczych pokazują, iż narzędzia oparte na sztucznej inteligencji doświadczają z upływem czasu problemów, z jakimi zmagają się starzejący się ludzie.