Koreańczycy “ożywili” głos zmarłej supergwiazdy dzięki sztucznej inteligencji

Nie pierwszy to raz w Korei, gdy zmarli muzycy wracają by znów zachwycać. W grudniu kanał muzyczny Mnet oddał hołd nieżyjącemu artyście posługując się śpiewającym hologramem. Na sylwestra supergrupa K-pop, BTS, wystąpiła w sieci wspólnie z w pełni cyfrową wersją Shin Hae-chul, członka grupy zmarłego w 2014 roku.

Puszczanie w eter komputerowo generowanego głosu ulubionego artysty z jednej strony wzbudza zachwyt fanów, szczególnie tych którym nie było dane usłyszeć go na żywo. Z drugiej, wymusza pytania np. o prawa autorskie do nagrania. Czy należą do AI, czy może do twórcy algorytmu sztucznej inteligencji?
SBS za prawo wygenerowania głosu zapłacił rodzinie tragicznie zmarłego Kwang-seok tę samą stawkę, co innym śpiewającym w programie artystom. Piosenka zaprezentowana w telewizyjnym show nie będzie wydana później w żadnej formie i na żadnym nośniku.

Program “Zawody Stulecia: Sztuczna Inteligencja kontra Człowiek” zostanie wyemitowany jeszcze w tym tygodniu. Producent show, Nam Sang-moon wyjaśnił CNN [LINK] https://edition.cnn.com/2021/01/25/asia/south-korea-kim-kwang-seok-ai-dst-hnk-intl/index.html [/link], że pomysł na pojedynek artystów z ich cyfrowymi kopiami przyszedł mu do głowy po obejrzeniu pojedynków człowiek-maszyna w grze Go. Piosenkarze i piosenkarki (np. Ock Joo-hyun, była wokalistka girl bandu Fin.K.L) będą musieli przekonać widownie, że są lepsi od sztucznej inteligencji.

Niejako przy okazji „pojedynków na śpiewanie” będzie miała miejsce premiera nowego materiału Kima, który zabił się w wieku 31 lat i u szczytu kariery. Z szacunku do uwielbianego artysty AI udający głos zmarłego nie będzie konkurował z nikim, a występował w duecie. Za odtworzeniem głosu zmarłego stoi firma Supertone, południowokoreański startup specjalizujący się w generowaniu treści dźwiękowych m.in. dla potrzeb twórców np. przy dubingowaniu seriali czy audiobookach.
[LINK] https://www.youtube.com/watch?v=WwUHX7oD_ak&feature=youtu.be [/link]

Stworzony przez nich program Singing Voice Synthesis (SVS) to technologia. która uczy się imitować różne głosy poprzez słuchanie piosenek łącząc je z zapisem nutowym i tekstami. Zanim SVS przystąpił do analizy głosu Kim Kwang-seoka, algorytm AI nauczył się wykonywać 100 piosenek autorstwa 20 różnych artystów. Jak wyjaśnia Supertone [LINK] https://edition.cnn.com/2021/01/25/asia/south-korea-kim-kwang-seok-ai-dst-hnk-intl/index.html [/link], wystarczająco dobrze poznał głos Kima by wiernie naśladować jego unikalny styl i wymowę.
[LINK] https://www.youtube.com/watch?v=JZMj46C9WQg&feature=youtu.be [/link]

W zapowiedzi programu słychać głos „AI Kima” wykonującego piosenkę „I Miss You”, balladę Kim Bum-soo z 2002 roku. – Odtworzony głos brzmi zupełnie jak on, jakby to Kim nagrywał w studio – przekonuje Kim Jou-yeon, cytowany przez CNN fan zmarłego artysty od 30 lat. Jeżeli nawet są chętni słuchania nowych utworów nieżyjącego artysty, są też ludzie zaniepokojeni kierunkiem, w którym rozwija się sztuczna inteligencja.

Dźwiękowe nagrania typu deepfake są realnym, choć nadal na dużą skalę niezrealizowanym, zagrożeniem dla demokracji (wpływanie na wybory etc.). Ważnym problemem jest kwestia ochrony własnego wizerunku. Firma badawcza Deeptrace w roku 2019 doliczyła się [link] https://www.bbc.com/news/technology-49961089 [/LINK] obecności w sieci 14 tys. takich wygenerowanych treści. 96 proc. z nich to były nagrania porno wykorzystujące twarze celebrytek, często właśnie z Korei Południowej. Z kolei symulacja głosu może być wykorzystywana przez oszustów wyłudzających pieniądze np. telefonicznie poprzez podszywanie się pod inne osoby.

Korea Południowa, kraj w forpoczcie rozwoju sztucznej inteligencji, szykuje odpowiednie przepisy prawne mające regulować stosowanie AI zarówno pod kątem etycznym, jak i praktycznym. Ministerstwo Nauki, Informacji i Technologii Komunikacyjnych w grudniu opublikowało „mapę drogową” przyszłej legislacji oraz „Narodowe Wskazówki Etyczne ds. AI”. Jest tam wyraźnie stwierdzone, że algorytmy sztucznej inteligencji muszą być tworzone jako narzędzia, które wykorzystywać trzeba w sposób etyczny.

W przypadku Supertone, CEO firmy Heo Hoon zapewnia [LINK] https://edition.cnn.com/2021/01/25/asia/south-korea-kim-kwang-seok-ai-dst-hnk-intl/index.html [/link], że właśnie dlatego współpracują tylko z biznesem, by kontrolować, czy ich AI wykorzystują organizacje stosujące ten etos co oni. Na “wszelki wypadek” w nagrania wychodzące z ich studia wpleciono swoisty znak wodny, niewykrywalny dla słuchacza, pozwalający jednak identyfikować ich treści jako stworzone przez sztuczną inteligencję.

Sztuczna inteligencja nie jest jeszcze na tyle sprawna, by sama komponować, pisać teksty i śpiewać, ale gdy dojdziemy to tego etapu (a pewnie dojdziemy), ktoś zacznie pytać o prawa własności do takich niezależnie od człowieka wytworzonych treści. Od tego już krok do nadania AI osobowości prawnej, gwarantującej jej – podobnie jak ludziom – ochronę wobec nadużyć.

Jan Sochaczewski