Meta AI szkoli się na treściach z torrentów
Dobrze wiemy, że sztuczna inteligencja, by działać sprawnie i oferować nam te wszystkie funkcje, musi być uczona poprzez prezentowanie jej ogromnych ilości danych. Te pozyskiwane są z różnych źródeł i w dużej mierze korzysta się z materiałów dostępnych legalnie w internecie. No, przynajmniej w większości przypadków, bo jak donosi Wired, Meta stosowała do tego spiracone materiały z torrentów. Gigant technologiczny został pozwany w 2023 r. za rzekome szkolenie Llama, swojego LLM, za pomocą pirackich treści. Sprawa stała się znana jako „Kadrey et al. v. Meta Platforms” i została złożona przez powieściopisarzy Richarda Kadreya i Christophera Goldena, którzy twierdzili, że Meta wykorzystała chronione prawem autorskim treści bez zezwolenia.
Czytaj też: Komunikator WhatsApp z nowym widżetem. Skorzystacie?
Wcześniej Meta przekazywała sądowi dokumenty, w których pewne informacje były ocenzurowane. Teraz jednak sędzia Vince Chhabria z Sądu Okręgowego Stanów Zjednoczonych dla Północnego Dystryktu Kalifornii nakazał upublicznienie oryginalnych dokumentów, co firma musiała zrobić. Pozwoliło to ujawnić rozmowy między pracownikami Mety dotyczące Meta AI i Llama. W nich, jeden z inżynierów, stwierdził, że „torrentowanie z firmowego laptopa [należącego do Meta] wydaje się niewłaściwe”. Z kolei z innej rozmowy wynika, że „MZ” (Mark Zuckeberg) autoryzował korzystanie z pirackich materiałów. Potwierdza to więc poprzednie zarzuty stawiane gigantowi.
Czytaj też: Odtwarzacz VLC w końcu zrobi dobry użytek z AI. Nadchodzi świetna funkcja

Meta pobierała treści z LibGen, ogromnej biblioteki zawierającej nielegalne książki, artykuły naukowe czy czasopisma, wszystkie chronione prawami autorskimi. Co ciekawe, LibGen istnieje od 2018 roku, przez cały ten czas będąc przedmiotem wielu pozwów o naruszenie praw autorskich. Powstała w Rosji baza wciąż jednak istnieje i jak widać, nawet giganci technologiczni z niej korzystają. Zgodnie z raportem, firma podobno sięgała też po inne tego typu biblioteki.
Czytaj też: Gemini na Androidzie zyskuje dawno zapowiadaną funkcję
Co na to Meta? Cóż, jak można było się spodziewać, nie przyznaje się do winy i jedynie twierdzi, że wykorzystywała materiały publiczne zgodnie z prawną doktryną „dozwolonego użytku”. Pozwala ona na korzystanie z treści chronionych prawem autorskim bez zezwolenia w pewnych okolicznościach, a te są analizowane indywidualnie. Meta nie jest zresztą jedynym gigantem technologicznym, który został oskarżony o trenowanie AI z wykorzystaniem materiałów będących pod ochroną praw autorskich. Żeby daleko nie szukać, zeszłoroczne dochodzenie wykazało, że model OpenELM firmy Apple zawierał napisy z ponad 170 tys. filmów z YouTube’a.