Czy twórcy algorytmów sztucznej inteligencji mogą legalnie wykorzystywać utwory do jej uczenia?

Uczenie algorytmów sztucznej inteligencji wykracza poza eksplorację tekstów i stanowi nowe nieznane pole eksploatacji utworów. Zagadnienie zgodności z prawem działań mających na celu uczenie (trenowanie) algorytmów sztucznej inteligencji (dalej: AI) jest problemem, który wymaga systemowego rozwiązania.

W dużej mierze sprawa legalności działania AI sprowadza się do odpowiedzi na pytanie: czy proces uczenia AI można ograniczyć jedynie do eksploracji tekstów (Text and Data Mining, TDM), czy też jest to inny proces, który można określić nowym, nienazwanym dotychczas polem eksploatacji utworów?

Mając na uwadze obowiązujące regulacje, można postawić tezę, że wykorzystywanie utworów jako materiału bazowego do działania AI może często się odbywać z naruszeniem praw autorskich podmiotów uprawnionych. Naruszenia te mogą dotyczyć zarówno danych wejściowych, jak i danych wyjściowych. W zakresie tych pierwszych należy zwrócić uwagę na działania związane z procesem trenowania AI, który odbywa się na zbiorach materiałów, z których znacząca część stanowi chronione prawem utwory. Wydaje się, że twórcy sztucznej inteligencji, aby rozpocząć proces trenowania algorytmu, są zmuszeni dokonać czynności stanowiących ingerencję w monopol prawny podmiotów uprawnionych, który sprowadza się do pobrania, utrwalania oraz zwielokrotniania w formie cyfrowej materiałów chronionych prawem autorskim.

Nie ulega wątpliwości, że jedną z kluczowych zasad prawa autorskiego jest, że ochroną może być objęty wyłącznie sposób wyrażenia utworu. Nie są objęte ochroną odkrycia, idee, procedury, metody i zasady działania oraz koncepcje matematyczne. Te więc mogą być swobodnie i bez ograniczeń wykorzystywane przez AI. Należy jednak zauważyć, że aby nabyć niechronioną prawnie wiedzę, konieczne jest w pierwszej kolejności zapoznanie się z chronionym prawem autorskim utworem, w którym tego rodzaju informacje są zawarte. Do wydobycia tej wiedzy często niezbędne jest wprowadzenie chronionego prawem autorskim materiału do pamięci komputera, w którym funkcjonuje system AI. Można założyć, że elementem tego procesu jest zwielokrotnienie (skopiowanie cyfrowe) takiego materiału, co samo w sobie może stanowić naruszenie praw autorskich.

Dla oceny zgodności z prawem działań polegających na trenowaniu algorytmów AI kluczowe znaczenie ma więc odpowiedź na pytanie: czy wprowadzony do ustawodawstw wewnętrznych niektórych państw, a także do prawa UE w art. 3 i 4 dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/790 z 17 kwietnia 2019 r. w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym oraz zmiany dyrektyw 96/9/WE i 2001/29/WE (dalej: dyrektywa DSM) wyjątek w zakresie TDM rozwiązuje wskazany problem naruszenia praw autorskich?

W naszej opinii na tak postawione pytanie należy udzielić odpowiedzi przeczącej. Przemawia za tym m.in. taki argument, że funkcjonowanie systemów AI w obszarze danych wejściowych i związany z tym proces trenowania algorytmów AI powinien być traktowany jako nowe, nieznane dotychczas pole eksploatacji utworów i przedmiotów praw pokrewnych, inne niż wymienione wyżej TDM. Konsekwencją tak postawionej tezy jest to, że wykorzystywanie utworów do uczenia algorytmów AI w zakresie, który wykracza poza proces określany mianem TDM, stanowi naruszenie praw autorskich, o ile nie mieści się w ramach jakiegoś z przewidzianych ustawą wyjątku (np. dozwolony użytek osobisty).

Ministerstwa wchodzą w AI. Ale ostrożnie i na własną rękę

Aby wykazać, że uczenie algorytmów AI nie sprowadza się jedynie do TDM, ale jest czymś więcej, należy zestawić ze sobą definicje TDM oraz różne definicje AI. Po ich analizie można stwierdzić, że celem procesu określanego mianem TDM jest jedynie wygenerowanie informacji obejmujących m.in. wzorce, tendencje i korelacje. Funkcjonowanie AI może natomiast daleko wykraczać poza generowanie informacji. Jednym z jej celów jest działanie na wzór ludzkiego intelektu, prowadzące do kreowania nowych bytów (utworów), np. tekstów czy obrazów. Tak więc informacje uzyskane w ramach procesu TDM są poddawane przez AI dalszej obróbce w taki sposób, że stają się one podstawą to kreowania nowych, nieistniejących wcześniej dóbr (utworów), które trudno nazwać li tylko nową informacją. Posługując się nomenklaturą prawa autorskiego, można powiedzieć, że AI informacjom, ideom, zasadom działania, które jest w stanie wyłowić z materiałów źródłowych dzięki procesom TDM, jest w stanie nadać „indywidualny sposób wyrażenia” i przez to wykreować nieistniejący wcześniej byt o charakterze niematerialnym (utwór).

W sytuacjach, w których działanie AI jest ograniczone do tworzenia nowych informacji, zasad, wzorców czy korelacji, jej działanie może się mieścić w ramach pola eksploatacji, którym jest TDM i korzystać z włączeń o których mowa w art. 3 i 4 dyrektywy DSM. Jeśli jednak tak wygenerowane dane przybierają określony sposób wyrażenia, są grafiką komputerową, utworem muzycznym lub tekstem literackim, działanie AI wykracza poza pole eksploatacji, którym jest TDM i może się odbywać jedynie za zgodą podmiotów uprawnionych z tytułu praw autorskich.

W praktyce więc TDM oraz funkcjonowanie algorytmów AI w pewnym zakresie nakładają się na siebie, istnieje jednak sfera działań AI, której cel znacząco odróżnia się od TDM. To spostrzeżenie prowadzi do wniosku, że regulacja prawna poświęcona TDM nie rozwiązuje problemu legalności uczenia maszynowego na podstawie utworów chronionych prawem autorskim.

Przedstawiciele branży rozrywkowej w USA doprowadzili do wysłuchania przed podkomisją sądownictwa Izby Reprezentantów ds. sądów, własności intelektualnej i internetu, podczas którego przedstawili swoje stanowisko w sprawie ich zdaniem nielegalnego wykorzystywania utworów przez sztuczną inteligencję. Zawnioskowali o rozwiązania ustawodawcze, które będą nakładały na firmy tworzące algorytmy sztucznej inteligencji obowiązek rekompensowania strat twórcom poprzez wprowadzenie nowego modelu licencjonowania utworów. Jak wykazuje analiza praktyki oraz dotychczasowych sporów sądowych zawisłych przed sądami w Stanach Zjednoczonych pomiędzy twórcami utworów a twórcami algorytmów AI, głównym problemem twórców broniących swoich praw jest wykazanie dowodów świadczących o tym, jakie utwory i w jakim zakresie zostały wykorzystane do szkolenia algorytmów AI w celu ustalenia konkretnego beneficjenta opłaty licencyjnej.

Bazując zatem na doświadczeniach twórców zza oceanu, skłaniamy się ku rozwiązaniom polegającym na wprowadzeniu ustawowego systemu rekompensaty twórcom strat, jakie doznają oni na skutek wykorzystywania ich twórczości przez AI opartego na swoistym domniemaniu, że korzysta ona z utworów prawa autorskiego. Idealnym rozwiązaniem byłoby zaimplementowanie tego typu rozwiązania na poziomie prawa UE. Jedynie ponadnarodowe regulacje prawne pozwolą skutecznie chronić prawa twórców i stworzą jednolite zasady rekompensowania strat. ©℗