W listopadzie 2025 r. do Sądu Okręgowego w Warszawie trafił pierwszy w Polsce pozew dotyczący nielegalnego wykorzystania głosu generowanego przez sztuczną inteligencję. Sprawa dotyczy Jarosława Łukomskiego – jednego z najbardziej rozpoznawalnych lektorów w kraju, którego głos miał zostać sklonowany i użyty w reklamach dużej spółki z branży wodno-kanalizacyjnej bez jego zgody, wiedzy i wynagrodzenia. Potwierdzono, że spoty powstały przy użyciu sztucznej inteligencji i emitowano je w ramach płatnej kampanii marketingowej. Głos utrwalony na nagraniach jest niemal identyczny z głosem Jarosława Łukomskiego. Rozstrzygnięcie wskazanej sprawy może okazać się precedensem w zakresie stosowania sztucznej inteligencji na rynku produkcji audio i reklamy w Polsce. Regulacji i wytycznych w tym zakresie, przynajmniej wyrażonych wprost, jeszcze nie ma. Należy jednak nadmienić, że sklonowanie i wykorzystanie czyjegoś głosu bez zgody stanowi naruszenie praw do wizerunku oraz, potencjalnie, przepisów dotyczących ochrony danych osobowych.

Wizerunek osoby fizycznej jest chroniony przez wiele różnych regulacji. W polskim porządku prawnym kilka aktów prawnych reguluje zarówno jego aspekt majątkowy – przykładowo rozpowszechnianie wizerunku, jak i osobisty – przykładowo prawo do prywatności. Na początku, w kontekście omawianej sprawy, istotne jest zaznaczenie, że wizerunek stanowi jedno z dóbr osobistych przysługujących każdemu człowiekowi, jak wskazano w art. 23 ustawy Kodeks cywilny, i nie powinno być co do tego wątpliwości. W orzecznictwie przyjęto, że w ramach prawa do wizerunku podlega również ochronie głos ludzki, który nie stanowi odrębnego dobra osobistego. Jest on elementem szerzej pojętego wizerunku człowieka, jego obrazem odbieranym za pomocą słuchu. Prawo osobiste do głosu należy więc traktować jako „dźwięczny wizerunek”, jednak pod warunkiem, że jest rozpoznawalny dla osób trzecich. Oznacza to, że głos danej osoby musi być na tyle charakterystyczny i wyróżniający się, by można było wskazać konkretną osobę, od której pochodzi (wyr. SN z 3.10.2007 r., II CSK 207/07, Legalis), J. Sadomski [w:] W. Borysiak (red.), Kodeks cywilny. Komentarz, wyd. 33, 2024, art. 23.). W sprawie naruszenia prawa do wizerunku Jarosława Łukomskiego nie można zatem przyjąć twierdzenia pozwanego, jakoby głos nie był chroniony jako część wizerunku, za zasadne.

Dobra osobiste mogą więc zostać naruszone w wyniku sklonowania głosu z użyciem sztucznej inteligencji, natomiast ważna jest również kwestia rozpowszechnienia wizerunku, w tym przypadku głosu, bez uzyskania wymaganej prawem zgody (art. 81 ust. 1 pr.aut.). Co prawda zastosowanie wskazanego przepisu w kontekście wykorzystania czyjegoś głosu budzi pewne kontrowersję, jednak zgodzić się należy z poglądem, iż „intencja wywołania identyfikacji z daną osobą, nawet bez jej bezpośredniego przedstawienia prowadzi do naruszenia prawa do wizerunku jako prawa do decydowania o formach obecności jednostki w przestrzeni publicznej. W tym ujęciu wizerunek nabiera znaczenia nie tyle jako wizualne odzwierciedlenie fizyczności, lecz jako narzędzie komunikacji. Obserwacja aktualnej praktyki medialnej pozwala sformułować tezę, że równie istotne (a często ważniejsze) niż konkretny obraz fizyczny człowieka są te cechy, które budują rozpoznawalność osoby - w tym też i głos osoby fizycznej" (A. Wilińska-Zelek [w:] J. Kępiński (red.), Ustawa o prawie autorskim i prawach pokrewnych. Komentarz, wyd. 1, 2025, art. 81, Nb 4.)

Osoba, której głos został sklonowany bez jej zgody na podstawie prawa cywilnego może domagać się:

  1. zaniechania tego działania (chyba, że nie jest ono bezprawne),
  2. żądać, by osoba, która dopuściła się naruszenia dopełniła czynności potrzebnych do usunięcia jego skutków oraz
  3. żądać zadośćuczynienia pieniężnego albo zapłaty odpowiedniej sumy na wskazany cel społeczny – na podstawie prawa cywilnego.

W przypadku ustalenia, że głos ujęty jest w definicji wizerunku wskazanego w art. 81 ust. 1 pr.aut., naruszyciel może zostać zobligowany do

  1. zaniechania naruszenia,
  2. usunięcia skutków naruszenia,
  3. naprawienia wyrządzonej szkody, oraz
  4. wydania uzyskanych korzyści (art. 79 ust. 1 pr.aut.).

Kolejną kwestią wymagającą poruszenia w kontekście niezgodnego z prawem sklonowania głosu Jarosława Łukomskiego, jest ochrona danych osobowych. Nie ulega wątpliwości, że głos zawarty jest w katalogu danych osobowych, gdyż umożliwia identyfikację konkretnej osoby fizycznej. Ponadto klonowanie głosu stanowi przetwarzanie danych osobowych. W związku z powyższym aktor powinien w pierwszej kolejności zostać poinformowany, że dane są przetwarzane i w jaki sposób. W szczególności wymagane jest wskazanie tożsamości i danych administratora, celów przetwarzania oraz podstawę prawną. Możliwe więc jest, że sprawa podlega również zgłoszeniu do Urzędu Ochrony Danych Osobowych.

Na marginesie wskazać należy, co zostaje poza zakresem samego sporu, że w wyniku działania firmy wodno-kanalizacyjnej wskazanej w pozwie, powstał tzw. deepfake (wygenerowana lub zmanipulowana przez sztuczną inteligencję treść audio, przypominająca istniejącą osobę) – w formie reklamy zawierającej materiał audio wygenerowany za pomocą sztucznej inteligencji wykorzystujący głos Jarosława Łukomskiego. Technologie deepfake i voice cloning rodzą poważne wyzwania prawne w kontekście ochrony wizerunku, głosu oraz danych osobowych. Należy więc pamiętać w szczególności o konieczności uzyskiwania zgód, informowania osób, których wizerunek czy głos są przetwarzane, ochronie ich dobrego imienia i prywatności. Treści typu deepfake stanowią ponadto istotne zagrożenie, przede wszystkim pod kątem manipulacji oraz wprowadzania w błąd odbiorców. Stąd niezwykle istotne i konieczne jest wskazywanie, że materiał powstał w sposób syntetyczny.

Nie ulega wątpliwości, że w sprawie wytoczonej przez firmę Mikrofonika, reprezentującej interesy Jarosława Łukomskiego w sporze, może dojść do wyznaczenia pewnych standardów ochrony głosu w kontekście sztucznej inteligencji. Proces może również zacząć kształtować sposób podejścia polskich sądów do AI. Przede wszystkim istotne jest ugruntowanie poglądu stanowiącego, że konieczne jest uzyskanie zgody na klonowanie głosu. Umożliwiłoby to lektorom, aktorom, a nawet politykom ochronę przed tego typu naruszeniami i dochodzenie roszczeń z nimi związanych. Jest to kwestia istotna również dlatego, że w wyniku klonowania głosu bez zgody może dojść m.in. do dezinformacji czy manipulacji. Skoro technologia umożliwia tworzenie nagrań, które wiernie odzwierciedlają głos konkretnej osoby możliwe są poważne nadużycia, którym należy zapobiegać.

Karolina Lutomirska, radca prawny, Fundacja MEAKULTURA