Meta pod ostrzałem. Gigant trenował swoją sztuczną inteligencję na pirackich treściach?

Wygląda na to, że temat sztucznej inteligencji nie może się obyć bez kontrowersji. Tym razem pod lupą znalazła się firma Meta, która została oskarżona o trenowanie swojego dużego modelu językowego (LLM), napędzającego Meta AI, na pirackich treściach z torrentów.
Meta pod ostrzałem. Gigant trenował swoją sztuczną inteligencję na pirackich treściach?

Meta AI szkoli się na treściach z torrentów

Dobrze wiemy, że sztuczna inteligencja, by działać sprawnie i oferować nam te wszystkie funkcje, musi być uczona poprzez prezentowanie jej ogromnych ilości danych. Te pozyskiwane są z różnych źródeł i w dużej mierze korzysta się z materiałów dostępnych legalnie w internecie. No, przynajmniej w większości przypadków, bo jak donosi Wired, Meta stosowała do tego spiracone materiały z torrentów. Gigant technologiczny został pozwany w 2023 r. za rzekome szkolenie Llama, swojego LLM, za pomocą pirackich treści. Sprawa stała się znana jako „Kadrey et al. v. Meta Platforms” i została złożona przez powieściopisarzy Richarda Kadreya i Christophera Goldena, którzy twierdzili, że Meta wykorzystała chronione prawem autorskim treści bez zezwolenia.

Czytaj też: Komunikator WhatsApp z nowym widżetem. Skorzystacie?

Wcześniej Meta przekazywała sądowi dokumenty, w których pewne informacje były ocenzurowane. Teraz jednak sędzia Vince Chhabria z Sądu Okręgowego Stanów Zjednoczonych dla Północnego Dystryktu Kalifornii nakazał upublicznienie oryginalnych dokumentów, co firma musiała zrobić. Pozwoliło to ujawnić rozmowy między pracownikami Mety dotyczące Meta AI i Llama. W nich, jeden z inżynierów, stwierdził, że „torrentowanie z firmowego laptopa [należącego do Meta] wydaje się niewłaściwe”. Z kolei z innej rozmowy wynika, że „MZ” (Mark Zuckeberg) autoryzował korzystanie z pirackich materiałów. Potwierdza to więc poprzednie zarzuty stawiane gigantowi.

Czytaj też: Odtwarzacz VLC w końcu zrobi dobry użytek z AI. Nadchodzi świetna funkcja

Meta pobierała treści z LibGen, ogromnej biblioteki zawierającej nielegalne książki, artykuły naukowe czy czasopisma, wszystkie chronione prawami autorskimi. Co ciekawe, LibGen istnieje od 2018 roku, przez cały ten czas będąc przedmiotem wielu pozwów o naruszenie praw autorskich. Powstała w Rosji baza wciąż jednak istnieje i jak widać, nawet giganci technologiczni z niej korzystają. Zgodnie z raportem, firma podobno sięgała też po inne tego typu biblioteki.

Czytaj też: Gemini na Androidzie zyskuje dawno zapowiadaną funkcję

Co na to Meta? Cóż, jak można było się spodziewać, nie przyznaje się do winy i jedynie twierdzi, że wykorzystywała materiały publiczne zgodnie z prawną doktryną „dozwolonego użytku”. Pozwala ona na korzystanie z treści chronionych prawem autorskim bez zezwolenia w pewnych okolicznościach, a te są analizowane indywidualnie. Meta nie jest zresztą jedynym gigantem technologicznym, który został oskarżony o trenowanie AI z wykorzystaniem materiałów będących pod ochroną praw autorskich. Żeby daleko nie szukać, zeszłoroczne dochodzenie wykazało, że model OpenELM firmy Apple zawierał napisy z ponad 170 tys. filmów z YouTube’a.