Google po cichu zaktualizował swoją politykę prywatności
Chyba większość z nas już wie, że do rozwoju i trenowania narzędzi opartych na sztucznej inteligencji potrzeba niewyobrażalnych ilości danych. A takie dane skądś trzeba brać. Google wpadł więc na pomysł, że będzie po prostu korzystał ze wszystkich publicznych informacji zgromadzonych w internecie. Gigant postanowił w weekend zaktualizować swoją politykę prywatności, dodając do niej kilka zapisów. Większość z nich to zapisy niewarte większej uwagi, ale na ich tle wyróżnia się jedna sekcja – ta dotycząca badań i rozwoju. Tutaj natrafić można na dość niepokojąco brzmiący zapis.
Google wykorzystuje informacje do ulepszania naszych usług oraz opracowywania nowych produktów, funkcji i technologii, które przynoszą korzyści naszym użytkownikom i ogółowi społeczeństwa. Na przykład używamy publicznie dostępnych informacji, aby pomóc trenować modele sztucznej inteligencji Google oraz tworzyć produkty i funkcje, takie jak Tłumacz Google, Bard i Cloud AI.
Google co prawda zapewnia, że cały czas firmowa polityka prywatności była przejrzysta. Od dawna wykorzystywano publicznie dostępne informacje z otwartej sieci do trenowania modeli językowych dla usług takich jak Tłumacz Google, a teraz po prostu uwzględniono również usługę Bard. Jednak dla przeciętnego użytkownika może być do dość osobliwy zapis. Chodzi o sposób, w jaki to sformułowano, bo brzmi to tak, jakby Google zastrzegał sobie prawo do zbierania i wykorzystywania wszystkiego, co znajdzie w publicznej części Internetu.
Jednak jednocześnie nie wyjaśniono w jaki sposób (i czy w ogóle) firma będzie zapobiegać włączaniu materiałów chronionych prawem autorskim do tej puli danych. Warto też zauważyć, że wiele witryn internetowych ma w swoich zasadach odpowiednie zapisy zabraniające gromadzenia danych w celu szkolenia dużych modeli językowych i narzędzi SI, więc ciekawi jesteśmy, jak w tym przypadku zachowywać się będzie Google. Dodatkowo równie interesującą kwestią będzie konfrontacja nowej polityki z takimi przepisami jak RODO, które przecież chronią nas przed niewłaściwym wykorzystaniem naszych danych bez naszej wyraźnej zgody.
Bo choć większość osób zdaje sobie sprawę, że to co wrzuca do sieci, jest już publicznie dostępne, to tutaj dochodzi do tego kwestia wykorzystywania tych danych, a to już zupełnie inna kwestia. Jak podejdzie do tego Google? Zwłaszcza teraz, gdy zaczyna przybywać nie tylko słów krytyki w odniesieniu do narzędzi opartych na sztucznej inteligencji, ale również pozwów. Najnowszy złożono przeciwko OpenAI, oskarżając twórców ChatGPT o wykradanie „ogromnych ilości danych osobowych z Internetu”, w tym „skradzione informacje prywatne”, w celu trenowania modeli GPT bez uprzedniej zgody. Można się spodziewać, że to dopiero początek. W tych okolicznościach działania giganta naprawdę nie wyglądają dobrze.