Generatory obrazów tworzonych przez sztuczną inteligencję istnieją w internecie już od jakiegoś czasu, jednak dopiero niedawno zrobiło się na ich temat głośno. Coraz więcej ludzi zastanawia się, jak traktować dzieła stworzone przez AI. Czy można je nazywać sztuką? I czy człowiek, który „zleca” sztucznej inteligencji wygenerowanie obrazu jest artystą?
Ponieważ temat sztuki nie jest mi obcy, postanowiłam dorzucić do tej dyskusji swoje trzy grosze i napisać, co sama myślę o tym wszystkim.
PS. We wpisie używam skrótu AI, który oznacza artificial intelligence, czyli sztuczną inteligencję. Zastanawiałam się nad wykorzystaniem polskiej wersji tego akronimu, czyli SI, ale zauważyłam, że w polskich artykułach na temat sztucznej inteligencji pojawia się głównie skrót AI, więc ja również zdecydowałam się na jego stosowanie.
Historia (sztuki) lubi się powtarzać
Kiedy wynaleziono aparaty fotograficzne, ludzie obawiali się, że zastąpią one tradycyjne malarstwo. Jednocześnie fotograf nie był uznawany za artystę, tylko technika naciskającego spust migawki.
Kiedy powstały pierwsze kina – ludzie przewidywali, że zabiją one teatry. Jednocześnie uważano, że aktorzy filmowi są gorsi od tych teatralnych (inna sprawa, że wtedy generalnie nie traktowano zawodu aktora poważnie).
Kiedy w domach pojawiły się pierwsze telewizory – ludzie byli pewni, że nikt nie będzie już chodził do kina. Jednocześnie prawie żaden szanujący się aktor lub reżyser nie myślał o pracy w telewizji.
Widzicie tu pewną analogię do obrazów wygenerowanych przez sztuczną inteligencję?
Coś więcej, niż wciśnięcie klawisza „Enter”
Moim zdaniem osoba wykorzystująca AI do tworzenia obrazów jest trochę jak fotograf.
W fotografii nie chodzi przecież po prostu o naciśnięcie migawki. Na to, czy zdjęcie będzie udane, składa się wiele czynników: począwszy od szczęśliwego zrządzenia losu i wyczucia chwili, poprzez rzeczy bardziej artystyczne, takie, jak wybranie odpowiedniego kadru i oświetlenia, a na kwestiach technicznych, związanych z umiejętnym posługiwaniem się aparatem, skończywszy.
Mało tego: na naciśnięciu spustu migawki praca fotografa bardzo często wcale się nie kończy. Wiele zdjęć zostaje później poddana, większej lub mniejszej, obróbce komputerowej.
Przykładowo, Rhine II Andreasa Gursky'ego, które jakiś czas temu zostało okrzyknięte najdroższym zdjęciem świata, jest fotografią mocno obrobioną cyfrowo. Autor usunął z niej rowerzystów, przechodniów i inne elementy, psujące kadr.
Pytanie więc, czy takie zdjęcie dalej można nazywać zdjęciem? I czy jego autor ma prawo nazywać się fotografem, czy może prędzej – powinniśmy go zaliczać do grona mistrzów Photoshopa?
W jaki sposób większość ludzi używa aparatów fotograficznych? Ja robię telefonem kilkanaście fotek tego samego, potem wybieram z nich wszystkich jedno, najlepsze. Dodaję mu kilka filtrów w apce, także na telefonie, i gotowe. Jeśli się sprężę, to cały proces: od zrobienia zdjęcia, do opublikowania go na Instagramie, zajmie mi maksymalnie pięć minut.
A jak to robią prawdziwi, profesjonalni fotografowie? Jeśli nie muszą zrobić zdjęcia szybko, żeby uchwycić jakiś moment, to na pewno zamontują w aparacie odpowiedni obiektyw, zadbają o to, by dobrze ustawić w nim wszystkie pokrętła i wykonają masę innych czynności, o których nam, zwykłym cykaczom fotek, nawet się nie śniło. A gdy już fotografia zostanie zrobiona, to prawdopodobnie spędzą masę godzin, jeśli nie dni, na jej późniejszej obróbce cyfrowej.
Wróćmy teraz do AI generującego obrazy. Czy z nim nie jest trochę, tak jak z tymi amatorskimi i profesjonalnymi fotografiami?
To znaczy: wiele z dostępnych w internecie generatorów obrazów ma bardzo ograniczone opcje. W chyba najpopularniejszym teraz Dall-E, mamy tylko okienko do wpisania tekstu. Natomiast w zaawansowanych (i często przy okazji płatnych) generatorach, do dyspozycji twórcy jest masa dodatkowych opcji, którymi jest się w stanie bardziej skalibrować, w jaki sposób AI ma generować obrazy.
Przykładem bardziej zaawansowanych generatorów obrazów są rozwiązania takie, jak Artbreeder (gdzie możemy przy pomocy suwaków, wpłynąć na to, co znajdzie się na wygenerowanych grafikach) lub Midjourney (tu z kolei używa się rozbudowanych poleceń tekstowych).
Odnoszę jednak wrażenie, że wiele osób, które mówią, że obraz wygenerowany przez AI nie jest sztuką, ma tu na myśli proste generatory takie, jak Dall-E. A przecież na nich świat artystycznej, sztucznej inteligencji wcale się nie kończy, tylko wręcz przeciwnie – dopiero zaczyna. A „dogadanie się” ze sztuczną inteligencją, żeby wykreowała obraz, który będzie nas satysfakcjonował, często jest procesem równie twórczym, jak wykonanie dobrej fotografii.
Polecam wam przeczytać artykuł na Antywebie, w którym jeden z twórców wykorzystujących AI opowiada, na czym polega jego praca. A jeśli rozumiecie język angielski, obejrzyjcie poniższe wideo, na którym częściowo opisany jest proces pracy z profesjonalnym generatorem obrazów AI.
Wyznaczmy granice!
Dyskusja dotycząca obrazów tworzonych przez sztuczną inteligencję wybuchła chyba dopiero za sprawą stworzonego w ten sposób Théâtre D'opéra Spatial, który wygrał konkurs malarski. To wydarzenie wywołało falę oburzenia i przerażenia, że oto sztuczna inteligencja okazała się lepsza od ludzi i zaraz wyśle wszystkich, prawdziwych artystów, na bezrobocie.
Z tym, że większość komentujących chyba znów nie miała do końca świadomości, jak wyglądał proces tworzenia takiego obrazu. Sztuczna inteligencja przecież sama nie wpadła na to, by dane dzieło namalować. To człowiek – Jason M. Allen – powiedział jej, co ma wygenerować. To człowiek kalibrował potem polecenie, jakie dał sztucznej inteligencji, by ta tworzyła obrazy, które jak najlepiej będą spełniały jego oczekiwania. To człowiek wybrał następnie z tych setek, jeśli nie setek tysięcy obrazów takie, które najbardziej mu pasowały. To człowiek – uwaga, bo to bardzo istotne – połączył i obrobił wygenerowane przez AI obrazy w innym programie graficznym, tak, by odpowiadały jego wizji artystycznej. I na końcu to człowiek – a nie maszyna – zgłosił powstały w ten sposób obraz do udziału w konkursie.
Nie wiem, jakie były zasady wspomnianego konkursu. Jeśli mogły być do niego zgłaszane prace typu digital-art, to moim zdaniem Théâtre D'opéra Spatial częściowo (choć nie całkowicie) zalicza się do tego gatunku. Jeśli jednak w wymaganiach było konkretnie napisane, że w grę wchodzą tylko obrazy malowane na płótnie, to praca Jasona Allena powinna zostać zdyskwalifikowana.
Czy Théâtre D'opéra Spatial jest zapowiedzią świata, w którym sztuczna inteligencja zabierze ludziom pracę?
Tu znów wracamy do fotografii i fotografów.
Wynalezienie aparatów fotograficznych nie zabrało pracy malarzom tworzącym na przykład portrety. Sprawiło natomiast, że osoby, które do tej pory nie mogły sobie pozwolić na zatrudnienie portrecisty – zyskały możliwość uwiecznienia się na fotografii.
Jednocześnie ludzie zauważyli, że fotografie mogą mieć wartość artystyczną, więc po prostu stwierdzili, że fotografia może być odrębną gałęzią sztuki, która zasługuje na własne konkursy.
Jak to się ma do sztucznej inteligencji? Weźmy na przykład mnie. Jestem osobą o dość dużej wyobraźni wizualnej, ale jednocześnie małych zdolnościach artystycznych. To powoduje, że moje próby namalowania obrazów, które siedzą w mojej głowie, zwykle kończą się fiaskiem. Jednocześnie nie stać mnie na to, by zatrudnić profesjonalnego artystę i polecić mu, żeby stworzył obrazy na podstawie tego, jak je opiszę. Mogę natomiast spróbować stworzyć takie obrazy przy pomocy sztucznej inteligencji, co będzie się wiązało z zerowym lub niewielkim kosztem. Przy czym, jeśli użyję AI, to człowiek-artysta nie straci możliwości zarobku, bo jak pisałam wcześniej – i tak nie byłoby mnie stać na to, by mu zapłacić. A co za tym idzie: sztuczna inteligencja nie zabiera pracy ludziom, tylko daje nowe narzędzia twórcze osobom, które wcześniej nie były w stanie zwizualizować tego, co siedzi w ich głowach.
Co się zaś tyczy oddzielenia sztuki generowanej przez AI od tej tradycyjnej, to dziś świat gna do przodu znacznie bardziej, niż w czasach pierwszych fotografii, więc obstawiam, że nastąpi to dość szybko. I być może już w tym roku powstaną konkursy dedykowane obrazom tworzonym przez sztuczną inteligencję.
Kradzież czy inspiracja?
Kolejną, jeszcze bardziej dyskusyjną kwestią, jest to, w jaki sposób sztuczna inteligencja powinna uczyć się malować. Nauka ta polega na tym, że AI pokazuje się gigantyczny zasób obrazów stworzonych przez ludzi i na ich podstawie sztuczna inteligencja generuje nowe obrazy. Rzecz w tym, że ten gigantyczny zasób namalowanych przez ludzi obrazów pochodzi oczywiście z internetu, a dokładniej – z serwisów takich, jak DeviantArt, gdzie artyści za darmo prezentują swoją twórczość. I niestety nikt nie zapytał użytkowników DeviantArtu, czy ci zgadzają się na to, by ich dzieła służyły do szkolenia sztucznej inteligencji.
Przeciwnicy AI mówią, że taki sposób szkolenia sztucznej inteligencji łamie prawa autorskie i kradnie własność intelektualną. Natomiast zwolennicy AI porównują cały proces do inspirowania się. Na takiej zasadzie, że jeśli człowiek pójdzie do galerii, gdzie zobaczy obraz, który go zainspiruje do namalowania własnego obrazu w podobnym stylu, to nie złamie tym samym prawa autorskiego. I tak samo – nie łamie go sztuczna inteligencja, która nie tworzy kopii innych dzieł, tylko własne obrazy na podstawie tego, co wcześniej „zobaczyła”.
Jakie jest moje zdanie na ten temat?
Tu nie potrafię udzielić jednoznacznej odpowiedzi.
Na pewno wiele zależy od tego, na jakiej licencji człowiek-artysta udostępnia swoje obrazy w internecie. Domyślnie każdy przejaw twórczej działalności ludzkiej o indywidualnym charakterze, jest chroniony prawem autorskim, tak zwanym copyrightem. Jednakże prawo to nie działa do końca dobrze w świecie cyfrowym (czyli nie tylko w internecie, ale generalnie w przypadku rzeczy tworzonych cyfrowo – takich, jak na przykład oprogramowanie), bo zabrania między innymi powielania dzieła bez zgody autora, przez co udostępnianie takiego dzieła dalej lub zapisanie jego kopii na dysku własnego komputera teoretycznie ZAWSZE jest przestępstwem. Z tego powodu powstały licencje, które w różny sposób modyfikują standardowe prawo autorskie. Przykładowo – wszystkie treści na Dyrdymałach dostępne są na licencji Creative Commons, która pozwala na udostępnianie umieszczonych tutaj treści dalej. Jednak po pierwsze należy wskazać, że to ja jestem ich autorką, po drugie zabronione jest udostępnianie moich wpisów w celach komercyjnych (czyli tak, że ktoś inny na nich zarobi), a po trzecie – na podstawie Dyrdymałów nie można tworzyć utworów zależnych. A takim utworem zależnym byłby tekst stworzony przez sztuczną inteligencję, która została nauczona pisania na podstawie wpisów na tym blogu.
Jeśli więc prace na DeviantArt były chronione standardowym prawem autorskim lub innymi licencjami, które zabraniały na ich podstawie tworzenia utworów zależnych, to moim zdaniem (ale pamiętajcie, że nie jestem prawnikiem!) „nakarmienie” sztucznej inteligencji takimi pracami łamie prawo, czyli jest kradzieżą.
Są jednak licencje mniej restrykcyjne. Ba! Istnieje nawet możliwość oddania dzieła do domeny publicznej, co tym samym powoduje, że autor zrzeka się praw autorskich, które mu do danej pracy przysługują. I podejrzewam (choć mogę się mylić i to tylko moje gdybanie), że część twórców internetowych udostępnia swoje dzieła na mniej restrykcyjnych licencjach, nie do końca zdając sobie sprawę z tego, z czym się to wiąże. Jeśli więc AI uczyła się tworzenia obrazów na podstawie dzieł objętych takimi właśnie, mniej restrykcyjnymi licencjami, to nie łamała prawa.
Kompromis z YouTuba?
Czy da się w jakiś sposób pogodzić interes twórców sztucznej inteligencji, którzy muszą pokazywać AI możliwie jak najwięcej obrazów, by rozwijać jej umiejętności, z prawami autorów tych obrazów?
Myślę, że możliwe są tutaj dwa scenariusze.
W pierwszym nastąpi podział na dzieła, na podstawie których może uczyć się sztuczna inteligencja i takie, z których AI nie może korzystać. Serwisy typu DeviantArt pozwolą użytkownikom na oznaczenie, czy zgadzają się na to, by ich dzieła były przetwarzane przez sztuczną inteligencję. Pojawią się też rozwiązania, które będą blokowały AI możliwość oglądania treści. Coś, co będzie działało na podobnej zasadzie, jak teraz ReCAPTCHA.
W kontrze do tego powstaną serwisy, do których będzie można wgrywać swoje obrazy właśnie po to, by na ich podstawie sztuczna inteligencja uczyła się malować. Trochę tak, jak teraz stocki ze zdjęciami (jej, znów nawiązanie do fotografii!) – część z nich będzie darmowa (twórcy obrazów nie będą zarabiali, ale ich dzieła będą pomagały w rozwoju darmowych i przy okazji także płatnych, generatorów obrazów), a część – płatna (twórcy będą zarabiali, ale ich prace będą służyły tylko do rozwoju płatnych AI).
Taki scenariusz na pierwszy rzut oka wydaje się sprawiedliwy. Jednak jeśli założymy, że technika pójdzie do przodu tak bardzo, że w przyszłości każdy z nas będzie w stanie w prosty sposób wyszkolić sobie swoje własne AI, to może się okazać, że takie rozwiązanie będzie równie efektywne, jak obecnie prawo autorskie w sieci. Które teoretycznie istnieje, ale w praktyce – kto z was ostatni raz sprawdził, czy ten ładny obraz lub zdjęcie, które podaliście dalej w social-mediach, nie było przypadkiem chronione copyrightem, który zabrania tego typu powielania?
Z tego powodu bardziej możliwy wydaje mi się drugi scenariusz. Taki, który będzie przypominał prawno-autorski kompromis z YouTuba.
Na czym polega ten kompromis? W dużym skrócie na tym, że jeśli wrzucimy na YouTube filmik, który w jakiś sposób łamie prawo autorskie (przykładowo jest fanvidem, który wykorzystuje fragmenty jakiegoś filmu i/lub serialu, i dodatkowo w podkładzie muzycznym ma znany utwór muzyczny), to nie pójdziemy za to do więzienia i najprawdopodobniej (choć tu wiele zależy już od umów, jakie YouTube podpisał z poszczególnymi wytwórniami filmowo-serialowo-muzycznymi) nasz filmik nie zostanie usunięty z YouTuba. Zamiast tego przed takim wideo będą wyświetlane reklamy, z których zyski zostaną przekazane twórcom dzieł, jakie wykorzystaliśmy w naszym wideo. Dzięki temu wilk jest syty i owca cała, czyli twórcy z YouTuba zyskują większą swobodę działania, a autorzy oryginalnych utworów nie mają poczucia, że są okradani z zysków.
Jak podobny kompromis miałby wyglądać w przypadku sztucznej inteligencji?
Generatory obrazów już teraz nie są całkowicie bezpłatne (zwykle za darmo można w nich stworzyć ograniczoną ilość obrazów, a za więcej trzeba zapłacić). I myślę, że część zysków z takich serwisów będzie szła do twórców obrazów, które posłużyły do nauki AI.
Oczywiście istnieje też możliwość, że w przyszłości obydwa z przedstawionych przeze mnie scenariuszy będą funkcjonowały jednocześnie. Albo – wręcz przeciwnie – nie sprawdzi się żaden z nich i opisany problem zostanie rozwiązany w inny, innowacyjny sposób.
Kto ma do tego prawo?!
Z obrazami generowanymi przez sztuczną inteligencję i prawem autorskim wiąże się jeszcze jedna, chyba najbardziej kluczowa kwestia. Mianowicie: czy dzieło stworzone przez sztuczną inteligencję może być objęte prawem autorskim? A jeśli tak, to komu to prawo będzie przysługiwać? Twórcy algorytmu, czy osobie, która zleciła AI wygenerowanie obrazu?
Polskie prawo mówi, że przedmiotem prawa autorskiego jest każdy przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażenia (cytat z Wikipedii).
Moim zdaniem w przypadku obrazów generowanych przez AI kluczowy będzie przejaw działalności twórczej. Trochę podobnie, jak… uwaga, nie w przypadku fotografii, ale artykułów prasowych!
Uznaje się, że napisanie krótkiej notki prasowej, brzmiącej na przykład: „jutro przewidywany jest mróz i opady śniegu” nie jest zbyt twórczym wyczynem, przez co taki tekst nie będzie chroniony prawem autorskim. Jeśli jednak ktoś tę samą informację przedstawi chociażby w formie fraszki, haiku lub w jakikolwiek inny, artystyczny sposób – wtedy będą mu już przysługiwały pełne prawa autorskie, ponieważ stworzenie takiego utworu wymagało twórczego działania.
I wracając do sztucznej inteligencji. Jeśli ktoś wpisze do generatora obrazów prostą frazę, przykładowo „kowboj jadący na koniu” i zadowoli się pierwszą grafiką, jaką stworzy mu AI, to takie działanie niemal na pewno nie będzie przejawem działalności twórczej. Jeśli jednak ktoś – podobnie jak wcześniej przestawione tutaj osoby wykorzystujące obrazy tworzone przez sztuczną inteligencję – spędzi wiele godzin na modyfikowaniu polecenia skierowanego do AI, wybieraniu najlepszego efektu pracy generatora obrazów i na koniec dodatkowo obrobi uzyskany wynik w innym programie graficznym – to dzieło takiego człowieka moim zdaniem jak najbardziej powinno podlegać ochronie prawno-autorskiej.
Jednakże tak, jak wspominałam wcześniej, ja nie jestem prawnikiem. A polskie prawo autorskie obowiązuje tylko w Polsce. I w chwili, w której piszę tego Dyrdymała, w amerykańskim sądzie toczy się proces dotyczący tego, czy komiks zawierający obrazy wygenerowane przez AI może być chroniony copyrightem.
Jak widzicie, batalia rozgrywa się na naszych oczach i niestety wiele wskazuje na to, że o tym, czy obrazy generowane przez AI będzie można nazywać sztuką, zadecydują amerykańscy sędziowie. Co jest moim zdaniem trochę przykre, bo przecież jakieś sto lat temu artyści sami stwierdzili, że wszystko może być sztuką, a każdy – artystą. I skoro w galerii może stanąć pisuar, który nazwiemy Fontanną, to przecież nic nie stoi na przeszkodzie, by obok niego zawisł Théâtre D'opéra Spatial (wiem, że to zdanie można odczytać trochę ironicznie, ale ja nie piszę go złośliwie!).
I na koniec pytanie do was, kochani czytelnicy! Czy korzystaliście już z opisanych w tym Dyrdymale generatorów obrazów (albo innych, podobnych rozwiązań)? Czy rzeczy namalowane przez sztuczną inteligencję was zachwycają, czy wręcz przeciwnie – przerażają? I czy waszym zdaniem AI przyczyni się do rozwoju sztuki, czy do jej upadku?
Nie bójcie się podzielić swoim zdaniem w komentarzu! :)︎
o ile nie zostało stwierdzone inaczej, grafiki ilustrujące wpis zostały wygenerowane przeze mnie, przy pomocy Midjurney lub Dall-E