Prowadzenie badań naukowych lub realizacja celów dydaktycznych w niektórych obszarach, zwłaszcza wpisujących się w zakres tzw. humanistyki cyfrowej (badania korpusowe, uczenie maszynowe, archiwistyka webu i in.), nie byłoby możliwe bez korzystania z dostępnych powszechnie zasobów cyfrowych. Do tej pory w przepisach prawa autorskiego posługiwano się mało precyzyjnym pojęciem “fragmentów większych utworów”, które – pod warunkiem uzasadnionego zakresu danego wykorzystania – pozwalało na swobodne prowadzenie badań (zob. Dz.U.2022.0.2509 t.j. – Ustawa z dnia 4 lutego 1994 r. o prawie autorskim i prawach pokrewnych).

Nowy projekt ustawy zawiera następujący przepis:

„Art. 27. 1. Instytucje oświatowe oraz podmioty, o których mowa w art. 7 ust. 1 pkt 1, 2 i 4–8 ustawy z dnia 20 lipca 2018 r. – Prawo o szkolnictwie wyższym i nauce, mogą na potrzeby zilustrowania treści przekazywanych w celach dydaktycznych lub w celu prowadzenia działalności naukowej korzystać z rozpowszechnionych utworów w oryginale i w tłumaczeniu, w tym zwielokrotniać rozpowszechnione drobne utwory lub fragmenty większych utworów nieprzekraczające 25% objętości utworu, pod warunkiem że korzystanie to nie ma charakteru zarobkowego oraz odbywa się na odpowiedzialność tych instytucji lub podmiotów, na ich terenie lub w innym miejscu, lub za pośrednictwem bezpiecznego środowiska elektronicznego dostępnego, dzięki zastosowaniu procedur uwierzytelniających, tylko dla uczących się i nauczających lub prowadzących działalność naukową w danej instytucji lub danym podmiocie.” (zob. tekst ustawy z 26.07.2024 r. po rozpatrzeniu poprawek Senatu)

Jak zwraca uwagę Centrum Kompetencji Cyfrowych UW, istnieją przynajmniej dwa istotne z punktu widzenia praktyki naukowej oraz zabezpieczania dziedzictwa cyfrowego problemy, których dotyka kształt nowej ustawy: problem ograniczania badań wykorzystujących metody text mining oraz uprawnień instytucji nauki i dziedzictwa w zakresie archiwizacji internetu.

W czasie prac nad ustawą CKC UW wyraziło swój sprzeciw wobec proponowowanych w niej zapisów. 11 lipca został on uwzględniony wraz z licznymi stanowiskami innych instytucji podczas posiedzenia Komisji Kultury i Środków Przekazu Senatu RP poświęconego pracom nad nowelizacją ustawy. W posiedzeniu wziął udział również Marcin Wilkowski, który osobiście zaprezentował stanowisko CKC UW (więcej szczegółów dot. posiedzenia Senatu POD TYM LINKIEM).

Stanowisko to podkreśla wagę uprawnień w zakresie zwielokrotniania i przetwarzania chronionych utworów dla nauki i dydaktyki. Poniżej prezentujemy jego pełną treść:

 

STANOWISKO CKC UW W SPRAWIE NOWELIZACJI USTAWY O PRAWIE AUTORSKIM

Wobec toczących się obecnie prac legislacyjnych nad projektem ustawy o zmianie ustawy o prawie autorskim i prawach pokrewnych oraz niektórych innych ustaw, Centrum Kompetencji Cyfrowych UW chce przedstawić dwa istotne z punktu widzenia praktyki naukowej oraz zabezpieczania dziedzictwa cyfrowego problemy, których dotyka kształt proponowanej nowelizacji.

Centrum Kompetencji Cyfrowych UW to jednostka UW wspierająca badania naukowe przez projektowanie i opracowywanie ich komponentów cyfrowych. Funkcjonująca w ramach CKC UW Pracownia Archiwistyki Webu to jedyna w Polsce inicjatywa naukowa poświęcona archiwistyce internetu.

Problem I: Wolność badań naukowych i wpływ prawa na metody badań korpusowych

Wprowadzenie sztywnego limitu 25 proc. objętości do regulacji uprawnień przetwarzania treści (art 27 ust. 1 projektowanej ustawy) będzie przepisem blokującym wolność prowadzenia badań. Przepis ten bezpośrednio i negatywnie wpływać będzie na metody badań, których dobór i kształt zależeć powinien wyłącznie od badacza/badaczki. W badaniach korpusowych (maszynowej analizy i interpretacji dużych zbiorów tekstów) oderwany od konkretnego zadania badawczego i specyfiki badanych treści limit 20 proc. dozwolonej objętości wprost podważy racjonalność metody badawczej.

Fundamentalną cechą korpusów badawczych jest reprezentatywność i zrównoważenie (V. Kamasa, Techniki językoznawstwa korpusowego wykorzystywane w krytycznej analizie dyskursu. „Przegląd Socjologii Jakościowej”, 2014, 2, s. 101). Te cecha korpusu może być zachowana także w przypadku korzystania wyłącznie z części dostępnych treści (zasobów). To badacz/badaczka jako jedyni są w stanie określić, wybór jak dużej części tekstów do analizy będzie najbardziej racjonalny. Jesteśmy zdania, że decyzja ta nie powinna należeć do legislatora, tym bardziej, że nie doprecyzowano, jak wyliczać ustawiony odgórnie limit 20 proc. (w przypadku książek np. czy ma zawierać okładkę, przypisy, bibliografię, czy tylko tekst merytoryczny). W praktyce badań korpusowych i podobnych takie sztywne ograniczenie będzie powszechnie ignorowane, a przepis stanie się martwy.

Problem II: Zabezpieczanie cyfrowego dziedzictwa i badania internetu

Pandemia COVID czy wojna w Ukrainie to tylko niektóre z wydarzeń, jakie dostępne będą przyszłym historykom w dużej mierze przez zachowane zasoby internetowe (od stron WWW przez materiały multimedialne aż po publikacje w mediach społecznościowych). Zasoby te zdecydowanie przynależą także do polskiego dziedzictwa (cyfrowego), którego ochrona należy do zadań polskich instytucji pamięci (biblioteki, archiwa). Art. 28 proponowanej ustawy mógłby zostać wykorzystany do zabezpieczenia uprawnień sektora nauki oraz instytucji pamięci do gromadzenia, przechowywania, badawczego analizowania i udostępniania (w określony sposób, np. na terminalach w siedzibie instytucji) części ogólnodostępnych zasobów WWW.

Archiwistyka Webu (web archiving) to dziedzina rozwijająca się od połowy lat 90., posiadająca własne metody, zbiory (archiwa Webu takie jak Wayback Machine), instytucje naukowe, czasopisma itp. Rozwój polskiej archiwistyki Webu, ale przede wszystkim możliwość zabezpieczania nietrwałych zasobów WWW dokumentujących ważne wydarzenia społeczne, polityczne czy kulturalne, wymaga odpowiednich regulacji prawnych. Polskie ustawodawstwo jest pod tym względem mocno opóźnione, np. większość krajów Europy zmodyfikowała swoje krajowe przepisy dotyczące egzemplarza obowiązkowego tak, aby umożliwić bibliotekom narodowym gromadzenie, przechowywanie, opracowywanie i udostępnianie w kontrolowanych warunkach archiwalnych zbiorów WWW (E. Vlassenroot et al., Web archives as a data resource for digital scholars, „International Journal of Digital Humanities”, 2019, 1. s. 89).

Podkreślamy też, że gromadzenie i przetwarzanie zasobów WWW jest nie tylko sprawą ochrony dziedzictwa cyfrowego, ale też należy do metod badań naukowych. Niekiedy w praktyce badawczej konieczne jest pozyskanie i przechowywanie obszernych zbiorów treści dostępnych online (w tym stron WWW), tak aby dalej je maszynowo przetwarzać i analizować.

Nowelizacja prawa autorskiego nie powinna ograniczać, ale ułatwiać badania naukowe i stworzyć warunki do legalnego pozyskiwania i gromadzenia publicznych zasobów WWW, czy to prowadzonego w ramach projektów badawczych, czy w ramach misji ochrony dziedzictwa cyfrowego, podejmowanych przez instytucje takie jak biblioteki i archiwa.

 

* * *

Senacka Komisja Kultury i Środków Przekazu odrzuciła wniosek o wykreślenie limitu 25% objętości utworu z przepisu określającego zasady korzystania z utworu na potrzeby zilustrowania treści przekazywanych w celach dydaktycznych lub w celach prowadzenia działalności naukowej. 26 lipca Sejm przyjął rządowy projekt zmian w ustawie o prawie autorskim.  29 lipca ustawę przekazano Prezydentowi do podpisu.

 

Tekst pierwotnie opublikowany został w portalu Humanistyka Cyfrowa na UW.