Kilka słów o prawie autorskim

Jak zapewne każdy bardziej doświadczony wikimedianin zdaje sobie sprawę, z problematyką wikimediów nierozerwalnie łączy się problematyka prawa autorskiego. Jednym z celów całego przedsięwzięcia jest uwolnienie jak największej ilości wiedzy (czy też utworów artystycznych w przypadku Wikisource i Wikimedia Commons). Jak to realizujemy w praktyce? Co robimy, aby nasi czytelnicy dostali treść jak najczystszą prawnie, jak najmniej obarczoną jakimkolwiek ryzykiem?

W zasadzie nie musimy robić nic. Wystarczy przeczytać informacje prawne do których link opublikowany jest pod każdą stroną, aby przekonać się, że projekty Wikimedia nie dają kompletnie żadnej gwarancji na cokolwiek, a więc i stroną prawno-autorsko nie ma się co przejmować. Oczywiście, co innego ochrona prawna, a co innego misja projektów, i na szczęście teoretyczne założenia wyglądają nieco inaczej, co widać na głównych stronach: Wikicytaty są dostępne na zasadach licencji CC-BY-SA-3.0 oraz GFDL, Wikiźródła to społecznościowy projekt, którego celem jest utworzenie wolnego repozytorium tekstów źródłowych, Wikipedia, Wikinews i Wikibooks to wolne [encyklopedia, serwis informacyjny, biblioteka podręczników], które każdy może redagować.

O co tak właściwie z tą wolnością chodzi? Sprawa jest ważka, a z tego co niekiedy czytam w ww. serwisach, zdarzają się w tej kwestii nieporozumienia. W moim przekonaniu, „wolność” to w tym przypadku zagwarantowanie użytkownikowi, że – po spełnieniu kilku łatwych do realizacji warunków – będzie mógł zaczerpnąć z ww. serwisów dowolne treści, w dowolnej ilości, i użyć je w całkowicie nieskrępowany sposób. Jest to przeciwieństwo zasady, jak ukształtowała się w prawodawstwie europejskim (amerykańskich chyba też, ale tu pewności nie mam) o podziale odpowiedzialności pomiędzy publikującego a korzystającego. W Polsce wyrazem tej zasady są przepisy o dozwolonym użytku chronionych utworów i o odpowiedzialności za przechowywanie danych z ustawy o świadczeniu usług drogą elektroniczną. Tam, gdzie gwarancji wolnej treści nie ma, użytkownik powinien sam rozważyć, czy może dane treści skopiować czy nie, a jeżeli może – to w jakim zakresie, a jak już coś skopiuje, to znowu musi rozważyć, czy i w jakim zakresie może skopiowane treści wykorzystać. Gwarantując wolność treści, wszystkie te problemy bierzemy na siebie. To my sprawdzamy, czy autorskie prawa majątkowe do teksu wygasły, czy prawo danego państwa daje „wolność panoramy” przy zdjęciach, czy nie  ma wątpliwości odnośnie autorstwa.

Problem pojawia się wtedy, gdy zapatrzeni w nasze wspaniałe projekty, zapominamy (albo chcemy zapomnieć) o użytkownikach. Mamy kilka zdjęć z lat 50., nie bardzo wiadomo kto je zrobił, ale świetnie by wyglądały w artykule – pojawia się  pokusa, aby je wrzucić i nieprawidłowo opisać. Przecież nikt się nie zorientuje, a szanse że zgłosi się ktoś z roszczeniami, są znikome! Albo mamy tomik wierszy znanego rosyjskiego poety w przekładzie z lat 70.; aż prosi się o wrzucenie na Wikiźródła. Ostatecznie, słyszał kto kiedy o procesie wytoczonym przez tłumacza o jakieś wiersze sprzed czterdziestu lat? I tak dalej…

Myślenie takie – wcale nierzadkie – przywodzi mi na myśl jazdę bez zapiętych pasów bezpieczeństwa, bo „przecież nigdy nic się nie stało”. Oczywiście nie jest tak, że w wikimediach nigdy żadnych problemów prawno-autorskich nie było; były i są, tylko że jest ich relatywnie mało, szybko i sprawnie się je rozwiązuje, a informacje o nich raczej nie docierają do szerokiego grona wikimedian. Bodaj największą aferą było czasowe zamknięcie francuskich Wikicytatów kilka lat temu, gdy okazało się, że skopiowana tam została baza cytatów wraz ze specyficznym ich układem (to o ten układ poszło). Drobniejsze sprawy wychodzą co jakiś czas, ale o procesie nie słyszałem, i chyba szybko nie usłyszę – w amerykańskiej kulturze prawnej 80% spraw kończy się ugodą pozasądową. Co do polskich projektów, to z tego co wiem, w najgorszym razie kończyło się na usuwaniu stron po interwencji autorów.

A jak to wygląda w praktyce? W swej wikimedialnej karierze działałem w trzech projektach – na Wikiźródłach, Wikipedii i i Wikicytatach, i – co ciekawe – w każdym z nich podejście do „wolnej treści” jest całkowicie inne.

Na Wikiźródłach okoliczności sprawiły, że opublikowana w projekcie treść jest tak wolna, jak to tylko możliwe pod rządami polskiego prawa autorskiego. Mało który współczesny autor (czy jego spadkobiercy) udostępnia swoje utwory na licencji Creative Commons, a jeżeli już – to bez możliwości komercyjnego wykorzystania. Efekt jest taki, że zamieszczamy niemal wyłącznie utwory, do których autorskie prawa majątkowe wygasły (tzw. „domena publiczna”). Na ponad 17 000 stron przestrzeni głównej projektu, ledwie 355 oznaczonych jest szablonem wolnej licencji, co pokazuje  z jakim stosunkiem mamy tu do czynienia. Teksty naruszające autorskie prawa majątkowe są niezwłocznie kasowane, inaczej bowiem niż na Wikipedii, nie ma możliwości „naprawienia” artykułu poprzez jego przepisanie czy skrócenie.

Wikipedia działa na słowo honoru, i to całkiem dosłownie. Niemal wszystkie artykuły na Wikipedii zamieszczone są na tzw. wolnej licencji, czyli „słowie honoru” autorów, że nie będą dochodzić autorskich praw majątkowych od osób, wykorzystujących zamieszczone przez nich treści zgodnie z licencją.  Rzecz to piękna, ale dla użytkownika nieco ryzykowna; wszak autorowi może się odwidzieć, poza tym jego spadkobiercy w żadnym razie nie są związani oświadczeniem o „uwolnieniu” treści. Problemem Wikipedii (dla mnie przynajmniej) jest dodawanie do artykułów cytatów na zasadzie dozwolonego użytku, ale bez oznaczenia autora (tłumacza, wydania itd.). Ktoś, komu wydaje się, że Wikipedia jest w całości udostępniana na wolnej licencji, może niemile się zdziwić, gdy skopiuje cytat z utworu, do którego żadne prawa nie wygasły.

Na Wikicytatach wolność projektu dotyczy raczej układu i doboru cytatów, aniżeli zamieszczanej treści.  Z tego co widzę, znaczna część (a może i większość) cytatów pochodzi ze współczesnych autorów, a także  filmów, polityków itp. Jeżeli cytowany jest twórca zagraniczny, tylko okazyjnie wymienia się tłumacza, rzadkością jest też podanie źródła. W sumie, z Wikicytatów korzysta się na własne ryzyko – tu już nawet nie chodzi o niezgodność z licencją Creative Commons, można mieć problem nawet z polskimi zasadami dozwolonego użytku, które wymagają podania autora (a więc i tłumacza) i źródła cytatu.

A pozostawiając kwestie prawno-autorsko-wolnościowe, jak zwykle na Wikiźródłach zawsze coś się dzieje w tematyce proofread.

Na początek może nieco triumfalizmu – otóż przedwczoraj polskie Wikiźródła przegoniły w  rozwoju sektora proofread projekt włoski, i wyszły na 4. miejsce w rankingu. Wielką Trójkę (de, en, fr) dogonić nie będzie łatwo, ale nie jest to tak istotne – najważniejsze, że postępuje modernizacja Wikiźródeł, wdrażanie najnowocześniejszych rozwiązań z korzyścią dla czytelnika.

Mamy też kilka nowych projektów:

Józef Ignacy KraszewskiKrzyżacy 1410, (tom 1. i tom 2.) – w ramach Wikiprojektu „Kraszewski 2012” staramy się na dwusetną rocznicę urodzin Józefa Ignacego Kraszewskiego przygotować na Wikiźródłach kompletny zbiór utworów tego autora. Krzyżacy 1410 opracowywani są właśnie w ramach tego przedsięwzięcia.fragmenty Konopnicka okładka

Józef Ignacy KraszewskiTomko prawdzić, utwór również przygotowywany z myślą o roku 2012. Nieco lżejsza pozycja tego autora, będzie nam umilać czas w przerwach między ciężkimi Krzyżakami.

Maria Konopnicka, Poezye w nowym układzie. Tom I, Fragmenty. Na Wikiźródłach Konopnickiej nigdy za wiele! Zbiór poezji, zamieszczony głównie dla celów porządkowych – pozwoli na zastąpienie „luźnych” tekstów opracowaniem w proofread.

Eliza Orzeszkowa, W klatce. Ciekawa powieść obyczajowa, znakomity kontrast dla będącej na ukończeniu Boskiej Komedii. Jak można zauważyć, dewizą Wikiźródeł jest różnorodność – po prawdzie, gdybyśmy zamknęli się w jednym rodzaju literatury, nie na długo by nam sił starczyło.

Reklamy

O pewnym słowniku

W ostatnim wpisie wspomniałem o Słowniku geograficznym Królestwa Polskiego, zaznaczając że mogą być problemy z prawami autorskimi do tej publikacji. Jak się okazało, wykrakałem całkiem spore problemy, które niemal doprowadziły do usunięcia Słownika z Wikiźródeł.

Zaczęło się stosunkowo niewinnie, od prośby o sprawdzenie, czy aby któryś ze 150 autorów Słownika nie przeżył do 1940 r. – ostatecznie, to nie problem pominąć kilka stron, czy nie?  No cóż, po bliższym zbadaniu okazało się, że w przypadku sześciorga autorów autorskie prawa majątkowe jeszcze nie wygasły (w jednym z przypadków wygasają dopiero w 2032 r.) na pewno. W kolejnych trzydziestu pięciu przypadkach nie udało się ustalić daty śmierci autora, co – biorąc pod uwagę, że wszyscy autorzy znani są z imienia i nazwiska – bardzo skutecznie zablokowało dalsze prace nad Słownikiem. Cóż było robić? Zorganizowaliśmy wielką debatę. Poddane zostały pod rozwagę różne pomysły, przy czym jedynym wyjściem wydawało się usunięcie z Commons wszystkich „niepewnych” stron, a następnie „przeskakiwanie” odpowiednich fragmentów w przestrzeni głównej na Wikiźródłach. Sam byłem za usunięciem Słownika w całości – obawiałem się, że nie starczy nam sił na monumentalne zadanie odsiania z Commons wszystkich problematycznych grafik, a następnie wielokrotne uzupełnianie indeksu.

Pewnie jednak skończyłoby się na potwornie mozolnej pracy na Commons, ale na szczęście przypomniałem sobie o „starych” Wikiźródłach, pełniących obecne rolę inkubatora nowych wersji językowych i właśnie przechowalni dla tekstów, do których wygasły autorskie prawa majątkowe w USA, ale gdzie indziej jeszcze nie. Słownik spełniał warunki publikacji na głównych Wikiźródłach – został w całości wydany przed 1923 r. i tak pojawiła się nadzieja, że coś uda się z tym projektem zrobić bez mordowania skanów i wykonywaniu karkołomnych skoków nad prawnoautorskimi przepaściami. Pomysł udało się zrealizować sprawnie i bez problemów, i tak oto dwa pierwsze tomy Słownika znalazły się wreszcie na stronie, na której bez problemu można nad nimi pracować.

Przy okazji wyszło na jaw, że polskie biblioteki cyfrowe niezbyt ściśle przestrzegają autorskich praw majątkowych, i że zawsze trzeba skrupulatnie sprawdzać stan prawny zamieszczonych materiałów, bo opisy potrafią być bardzo mylące. Słownik geograficzny Królestwa Polskiego jest łatwo dostępny, zarówno w skanach jak i w OCRze, na stronach kilku takich instytucji. Na jednej z nich znajduje się nawet zapewnienie, że opublikowany materiał jest na licencji Creative Commons… Swoją drogą, badając sprawę wdrożenia na Wikiźródłach standardu Dublin Core, kilka tygodni temu trafiłem na forum bibliotekarzy zajmujących się właśnie bibliotekami cyfrowymi. To, co tam wypisywano na temat praw autorskich do tekstów zamieszczonych w tychże bibliotekach (i ich opisywaniu) upewniło mnie, aby polegać przede wszystkim na ustawie.

Oczywiście, na Słowniku nie kończą się wikiźródlane nowości.

Co jakiś czas docierają do mnie – najczęściej podsyłane przez wikimedian – informacje o różnego rodzaju inicjatywach w rodzaju „Biblioteka XYZ przeprowadza wielką digitalizację zbiorów XYZ. Zdigitalizowanych zostanie ponad (tu jakaś budząca szacunek liczba) stron tekstu.” Informacji tej najczęściej towarzyszy sugestia, że moglibyśmy (my, tzn. zespół Wikiźródeł) coś w tej sprawie zrobić, tzn. nawiązać współpracę i opracować co ciekawsze pozycje. Sugestia taka nieodmiennie spotyka się z moją odpowiedzią, że oczywiście, świetnie byłoby nawiązać współpracę itd., ale nie ma komu, bo jest nas za mało. Ostatnio, po kolejnej tego rodzaju propozycji, postanowiłem sprawdzić, ile tak naprawdę działa w projekcie osób, i jakimi dysponujemy siłami.

Zacząłem od strony „Lista aktywnych użytkowników”, która dokumentuje użytkowników działających w projekcie w ciągu ostatnich 30 dni. Wyszło, że było nas 57. Odjąłem dwa boty, pacynkę, zespół SWMT (bardzo cenię ich pracę, ale tu akurat chodzi mi o innego rodzaju wkład), użytkowników jedynie dodających interwiki czy też wykonujących zadania globalne zlecone na Meta i zostały mi 44 osoby. Z tego 16 osób miało w ciągu ostatnich 30 dni więcej niż 30 edycji, a mniej więcej 5-8 w ciągu ostatnich miesięcy udziela się w dyskusjach w Skryptorium czy na kanale IRC, czyli zajmuje się szeroko rozumianą polityką projektu.

Praktyka pokazuje, że takimi siłami możemy opracować ze trzy krótkie publikacje miesięcznie (tak po 80 stron każda), a raz na kilka miesięcy coś większego (Pana Tadeusza, czy Encyklopedię Staropolską). O czymś takim, co marzy się osobom sugerującym – czyli że weźmiemy te kilkaset tysięcy (czy nawet kilka milionów) stron skanów i raz-dwa obrobimy, można zupełnie zapomnieć. Tak na marginesie, zupełnie nie rozumiem, skąd wzięło się przeświadczenie, że najtrudniejszą częścią w opracowaniu tekstu jest skanowanie i wykonanie OCRa. Może tak było kiedyś, gdy skanery były trudno dostępne, a programy do OCRa kiepskie, ale teraz jest zupełnie inaczej – skanów i OCRów mamy pod dostatkiem, za to brakuje osób do korekty i wikizacji.

Jak zwykle, mamy też kilka nowych projektów proofread.

Zygmunt Miłkowski, Do spółobywateli: list otwarty. Obszerny artykuł o tematyce polityczno-społecznej Zygmunta Miłkowskiego, znanego szerzej jako Teodor Tomasz Jeż.

Ave Maria - okładka

ks. Karol Bołoz, Książka do nabożeństwa. Jeden z dwóch modlitewników których opracowywanie rozpoczęliśmy ostatnio na Wikiźródłach. Niestety, jeżeli chodzi o modlitwy i litanie, dotychczas na Wikiźródłach panował niesamowity nieład, sporo też znalazło się tekstów naruszających prawa autorskie. Publikacja kompletnych modlitewników powinna umożliwić uporządkowanie tego działu w projekcie.

Józef Chociszewski, Ołtarzyk polski katolickiego nabożeństwa zawierający najużywańsze modlitwy, pieśni i rozmyślania. Podobnie jak powyższa Książka do nabożeństwa ks. Bołoza, Ołtarzyk polski również znalazł się na Wikiźródłach z myślą o uporządkowaniu projektu.

Bolesław Prus, Antek. Znany utwór znanego autora, w końcu w wersji proofread. Prace nad Antkiem są już stosunkowo zaawansowane, jak się okazało największy problem sprawiają reklamy, zajmujące znaczną część książki, z którymi nie bardzo wiadomo co robić.

Antonina Domańska, Ave Maria. Krótka powiastka historyczna, sądząc z pobieżnej lektury nic szczególnego, ale przynajmniej szybko się opracuje.

O zmianach i nowych projektach

Pomimo okresu urlopowo-wakacyjnego, na Wikiźródłach praca wre. Jeżeli chodzi o dynamikę rozwoju sektora proofread, nie mamy sobie równych – nie dalej jak wczoraj wyprzedziliśmy projekt hiszpańskojęzyczny, i weszliśmy na 6. miejsce w rankingu. Zwraca uwagę znaczna liczba stron uwierzytelnionych (w pełni opracowanych) – nie tylko szybko się rozwijamy, ale i coraz bardziej zwiększamy jakość publikowanych utworów. Sukcesy te oczywiście są zasługą stale rosnącej grupy osób z uprawnieniami redaktorskimi (obecnie równo 30).

A w związku z powyższym, zacząłem czynić pierwsze, bardzo ostrożne i sondażowe przymiarki do całkowitego przejścia Wikiźródeł z „tradycyjnego” systemu publikowana treści na proofread. Biorąc pod uwagę, że właściwie tylko teksty oparte na skanach dają gwarancję wysokiej jakości, uważam takie przejście za niezbędny krok na drodze uczynienia z Wikiźródeł serwisu naprawdę użytecznego dla czytelnika. Nie strony, na której co najwyżej  „można se poczytać”, ale także strony, z której można kopiować utwory bez obawy, że trafi się na jakieś bzdury w tekście lub lichy OCR.

Pierwsze rozmowy poczynione w tym temacie pozwalają z optymizmem patrzyć na losy propozycji, ale mam też świadomość, że jest ona bardzo rewolucyjna. Nawet jeżeli zostanie wprowadzona w życie, przypuszczam że nie w formie bezwzględnej zasady – konieczne będzie zrobienie miejsca na wyjątki.

Mam też wielką chęć na włączenie Wikiźródeł  systemy informacji o zdigitalizowanych tekstach (np. NUKAT), a do tego trzeba by mieć solidny „towar” i profesjonalny system opisu tekstów, myślałem o wprowadzeniu Dublin Core. Ale to musi poczekać – ludzi brak, na bibliotekoznawstwie nikt u nas się nie zna,  a wprowadzanie zbyt wielu zmian naraz może się negatywnie odbić na projekcie. Niemniej jednak, uważam to za wykonalne.

A poza tym na Wikiźródłach…

Ostatecznie przyjęte zostały zasady odbierania uprawnień administratora/biurokraty. W listopadzie 2010 r. nastąpi pierwsza weryfikacja tychże, i naprawdę jestem ciekaw, co z tego wyjdzie – pomijając podobne zasady dotyczące biurokratów na Wikipedii, jest to pierwsza tego rodzaju inicjatywa w polskojęzycznym projekcie. Mimo wszystko, nie oczekuję jakiejś szczególnej rewolucji; podobne instytucje od dawna działają na anglojęzycznych Wikiźródłach i na Meta, i z tego co jest mi wiadome, nie budzą żadnych kontrowersji.

Dzięki ogromnej pracy wykonanej przez sp5uhe i Tommy’ego_Jantarka, mamy obecnie zautomatyzowane wyświetlanie „tekstów dnia” na stronie głównej  (trzy różne na każdy dzień). Oszczędza to masę pracy przy SG, nie trzeba też pamiętać o wstawianiu następnego tekstu pod koniec miesiąca. Poprzednio rodziło to kłopoty – niekiedy zapominaliśmy o uzupełnianiu SG, i dopiero czerwone linki na początku miesiąca przypominały nam, że trzeba by coś wrzucić.

Niestety, nadal nie został rozwiązany problem nowych tekstów na SG. W zasadzie mamy konsensus co do tego, że powinny one się tam znajdować, ale w praktyce nikomu nie chce się po dodaniu nowego utworu aktualizować odpowiedniego szablonu. Jest to o tyle zrozumiałe, że niekiedy po ukończeniu projektu proofread utwory dodawane są masowo (np. 50 za jednym zamachem), co edycję szablonu czyni bardzo niewygodną. Rozwiązaniem mógłby być system automatycznego aktualizowania znany z Wikinews, ale jego uruchomienie na Wikiźródłach wymagałoby pracy tak koncepcyjnej, jak i informatycznej – a chwilowo nie mamy na to sił.

Mamy też kilka nowych projektów:

Felicjan Faleński, Meandry; zbiór niezbyt (dla mnie przynajmniej) ciekawych krótkich utworów poetyckich tegoż autora. Dużo „mundrości” życiowych, niemalże „100 powiastek dla dorosłych” (by sparafrazować  tytuł zbioru Shmida). Nie da się ukryć, że wszelki dydaktyzm w literaturze mnie irytuje, o wiele bardziej wolę „sztukę dla sztuki”, i już bardziej chłopomania Konopnickiej do mnie przemawia. Ale cóż – jest poezja, jest OCR, szybko się zrobi. a kto wie – może się na coś komuś przyda.

Słownik geograficzny Królestwa Polskiego (licznych autorów); kolejne na Wikiźródłach dzieło o charakterze encyklopedycznym, w 14. tomach (na razie opracowujemy dwa). Biorąc pod uwagę, że w sieci można znaleźć już dobrze opracowany OCR, przypuszczam że praca pójdzie stosunkowo szybko. Obawiam się jedynie wejścia w prawa autorskie – ostatni tom wydany został w 1902 r., czyli wchodzimy już w „niebezpieczny” pod tym względem XX wiek. Niestety, przekonane że co wydane w XIX wieku jest bezpieczne, nie do końca się sprawdza, co sam miałem okazję sprawdzić przy okazji opracowywania Encyklopedii kościelnej, której ostatni autor zmarł w 1945 r.

Stefan Kołaczkowski, Twórczość Jana Kasprowicza. Krytyczne opracowanie twórczości tegoż autora, pochodzące z 1924 r. Tekst interesujący i pożyteczny, acz z uwagi na dosyć skomplikowaną strukturę obawiam się, że dosyć długo będzie leżał na stronie projektów.

« Older entries Newer entries »