Manuskrypt Wojnicza: Szyfr doskonały

Superkod nie do złamania to mit. Chyba że stworzymy sztuczny język, w którego strukturę wpleciemy poważny błąd, – mówi Marcelo Montemurro, fizyk tak jak w Manuskrypcie Wojnicza teoretyczny zajmujący się teorią informacji.

NAJBARDZIEJ TAJEMNICZY MANUSKRYPT ŚWIATA

Manuskrypt Wojnicza to średniowieczna księga powstała między 1404 a 1438 rokiem. Przed zastosowaniem metody datowania radiowęglowego jego autorstwo przypisywano m.in. filozofowi Rogerowi Baconowi, alchemikowi Edwardowi Kelleyowi i okultyście Johnowi Dee. Do dnia dzisiejszego przetrwało 120 kart manuskryptu, zawierających skomplikowane rysunki i zapisanych tajemniczym pismem. W 1912 roku manuskrypt odkrył Michał Wojnicz , znany też jako Wilfried M. Voynich – polsko-amerykański bibliofil i antykwariusz.

Mimo wielu prób podjętych zarówno przez kryptologów, jak i amatorów, nikomu nie udało się rozszyfrować nawet krótkiego fragmentu Manuskryptu Wojnicza. Niektórzy badacze stwierdzili wręcz, że został on spreparowany, a język, w którym go napisano, to niezawierający żadnego przekazu zestaw przypadkowych znaków. Takiej teorii przeczą ustalenia Marcelo Montemurro i Damiana Zanette z Uniwersytetu w Manchesterze. Dokonana przez nich analiza statystyczna wykazała, że w tekście Manuskryptu występują te same schematy, na których opierają się języki naturalne. Oznacza to, że oprawiony w skórę tom może jednak zawierać jakiś do tej pory niezrozumiały przekaz.

Tomasz Augustyniak: Nikomu nie udało się dotąd odczytać Manuskryptu Wojnicza. Czyżby do jego zapisania użyto kodu nie do złamania?

Marcelo Montemurro: Przeczy temu fakt, że słowa w tej książce zachowują się zgodnie z tak zwanym rozkładem Zipfa. Zakłada on, że między częstotliwością występowania poszczególnych słów w języku zachodzi pewna relacja matematyczna. Jest obecna we wszystkich językach świata, również w tym, w którym napisano Manuskrypt Wojnicza.

T.A.: Zaraz, zaraz. Manuskrypt Wojnicza jest więc językiem, a nie, jak twierdzi wielu uczonych, sfabrykowanym bełkotem?

M.M.: Jest językiem i potwierdzają to nasze analizy – statystyka występowania słów w Manuskrypcie Wojnicza wygląda dokładnie tak jak w dzisiejszych książkach i gazetach. Jeśli tekst z Manuskryptu Wojnicza miałby być sfabrykowany, to dlaczego zachowuje regułę Zipfa? W XV wieku nie dałoby się tak sfałszować tekstu, bo nikt wtedy o Zipfie nie słyszał.

T.A.: A nie da się skutecznie zakodować jakiegoś tekstu w taki sposób, żeby to, co uzyskamy, nadal przypominało język? To tłumaczyłoby sens powstania tego Manuskryptu.

M.M.: Kiedy kodujemy tekst, niszczymy przy okazji statystyczną strukturę języka, a tekst przestaje być zgodny z rozkładem Zipfa. Raczej przychylałbym się więc do opinii amerykańskiego kryptologa Williama F. Friedmana, że autor Manuskryptu próbował stworzyć nowy system komunikacji. Manuskrypt Wojnicza to sztuczny język albo zapis nieudanej próby stworzenia takiego języka.

 

T.A.: Czyli, żeby zapisać coś w sposób niemożliwy do odczytania, trzeba wymyślić sztuczny język i popełnić jakiś błąd?

M.M.: Na pewno można w ten sposób znacznie utrudnić odczytanie takiego tekstu. Ale trzeba pamiętać, że w zamierzeniu autorów sztuczne języki są jednak systematyczne, łatwe do odczytania. Nasz wolumin Wojnicza jest datowany na XV wiek. Dwieście lat później mamy już przykłady sztucznych języków filozoficznych. Ich twórcom chodziło o to, żeby były algorytmiczne, miały systematyczną hierarchię. Słowa, które odnoszą się do siebie semantycznie, powinny być do siebie podobne morfologicznie.

T.A: Ale udało się to dopiero Johnowi Wilkinsowi w XVII wieku?

M.M.: Wilkins, jeden z założycieli The Royal Society of London, wszechstronnie wykształcony filozof, próbował stworzyć język oparty właśnie na takim założeniu. Sklasyfikował wszystkie znane sobie przedmioty. W zależności od kategorii, do której należał dany przedmiot, żeby uzyskać jego nazwę, do rdzenia należało dodać odpowiedni prefiks. Na przykład nazwy wszystkich zwierząt zaczynałyby się od tej samej sylaby, ponieważ należą do tej samej podkategorii. Ale język księgi Wojnicza nie jest już taki spójny i logiczny na wszystkich poziomach. Moim zdaniem coś poszło nie tak i dlatego łamiemy sobie nad nim głowę.

T.A.: Czy dziś można jakoś wykorzystać te sztuczne języki?

M.M.: Poważnie w to wątpię. Na przykład filozoficzny język Wilkinsa opiera się na słownictwie, w którym forma i znaczenie splatają się ze sobą. Słowa w tym języku korespondują z hierarchiczną organizacją przedmiotów – zarówno materialnych, jak i abstrakcyjnych – na trzy sposoby. Wyrazy należące do podobnych klas będą miały podobną morfologię. A to czyni ten język bardzo podatnym na szumy komunikacyjne.

T.A.: Czyli na zatłoczonej stacji metra moglibyśmy mieć kłopoty ze zrozumieniem rozmówcy.

M.M.: Dokładnie tak! Weźmy na przykład nowszy język – ro. Słowo „dufad” oznacza w nim drzwi, zaś „dufaf ” – okno. Jeśli pomylimy tylko jedną literę, znaczenie słowa mocno się zmieni. Porównajmy to z hiszpańskim „puerta” i „ventana”. Gdyby ludzie rozmawiali szybko w jakimś hałaśliwym otoczeniu używając słownictwa z języka ro, komunikacja praktycznie nie byłaby możliwa. Jedną z ważnych cech języków naturalnych jest ich praktyczność. Języki filozoficzne byłyby niesamowicie kruchymi narzędziami komunikacji. Pozostaną raczej w sferze marzeń i planów. 

T.A.: A co z językami takimi jak esperanto i interlingua?

M.M.: To trochę inna para kaloszy. Takie eksperymenty odniosły pewien sukces, esperanto ma setki tysięcy użytkowników. To jednak język wymyślony na bazie języków naturalnych, który pożyczył gramatykę i słownictwo od innych, nadając im prostą i logiczną strukturę. A mimo to nie zdobył pozycji lingua franca, jakim kiedyś była łacina. To miejsce zawsze zajmowały języki naturalne, które stały się dominujące ze względu na pozycję swoich użytkowników. Życie uczy więc, że zamiast próbować tworzyć powszechny sztuczny język, lepiej dokładniej zbadać te, które już są używane.

T.A.: Analiza Manuskryptu Wojnicza nie ma więc sensu?

M.M.: Ma, jeśli potraktować ją jako test, który przyda się w innych dziedzinach. Manuskryptem Wojnicza zainteresowałem się po przeczytaniu w magazynie „Scientific American” artykułu Gordona Rugga, który twierdził, że ta książka jest mistyfikacją. Pomyślałem, że nadarza się świetna okazja do zastosowania wcześniej opracowanej metody wyodrębnienia semantycznych informacji z tekstu, którego język jest nam zupełnie nieznany.

T.A: Na czym polega ta metoda?

M.M.: Najpierw, bazując wyłącznie na statystyce, nauczyliśmy się rozróżniać poszczególne klasy słów i określić hasła definiujące zakres tematyczny tekstu. W niektórych wypadkach potrafiliśmy stwierdzić, czy dane słowo jest czasownikiem czy rzeczownikiem. Dzięki napisanemu przez nas programowi przeanalizowaliśmy tak około pięciu tysięcy anglojęzycznych książek. Kiedy nasza metoda była już wystarczająco rozwinięta, zajęliśmy się Manuskryptem Wojnicza. Analiza zajęła komputerowi tylko kilka sekund! Program wyodrębnił powtarzające się słowa i pomógł określić, które z nich są kluczowe dla podejmowanych tematów.

 

T.A.: Czy w tej analizie przydały się rysunki z Manuskryptu?

M.M.: Nawet bez nich moglibyśmy śledzić sposób, w jaki używane są kluczowe, domniemane słowa. Możemy nawet przygotować na ich podstawie skorowidz. Analizując Manuskrypt użyliśmy całej naszej wiedzy o tym, jak w istniejących językach naturalnych słowa zmieniają się wraz z tematem. Kiedy ten się zmienia, pojawia się także nowy zestaw słów.

T.A.: Można oszacować, ile tematów pojawia się w Manuskrypcie?

M.M.: To ciekawe pytanie, nie próbowaliśmy tego jeszcze robić. Otrzymaliśmy słowa, które są istotne dla całości przekazu, ale należą do różnych tematów.

T.A.: Zrobiliście coś jeszcze poza przygotowaniem skorowidza?

M.M.: Dysponując kluczowymi hasłami przeanalizowaliśmy sposób, w jaki zostały one użyte. Teoria informacji zakłada, że słowa, które pojawiają się w podobnym kontekście, powinny być semantycznie powiązane. Sprawdziliśmy, które pozostają w relacji z którymi i wypisaliśmy wszystkie typy relacji między nimi – zarówno silne, jak i słabe. Później skupiliśmy się na słowach o najsilniejszym połączeniu, tych, które zwykle pojawiały się w swoim towarzystwie. Okazało się, że mają podobną budowę. W wielu językach – myślę, że również w polskim – zdarza się, że słowa powiązane znaczeniowo wyglądają podobnie. Dzieje się tak dlatego, że często są po prostu odmienionymi formami o tym samym rdzeniu. W Manuskrypcie niemal wszystkie semantycznie powiązane słowa są podobne morfologicznie. To ważna i niezwykle interesująca cecha tego języka.

T.A.: Z którego ciągle nie możecie zrozumieć ani słowa?

M.M.: Nie musimy rozumieć tekstu, żeby go analizować. Sprawdziliśmy naszą metodę na języku mandaryńskim. Z krótkiej partii materiału z powodzeniem wybraliśmy dziesięć słów, które z dużym prawdopodobieństwem określały jego zakres tematyczny. Oczywiście odcyfrowanie Manuskryptu Wojnicza byłoby wielkim wydarzeniem, ale chyba nie jesteśmy jeszcze na to gotowi.

T.A.: Może to właśnie ilustracje są kluczem do jego odczytania?

M.M.: Do tej pory się na nich nie skupialiśmy. Połączenie poziomu obrazu i tekstu, sprawdzenie, czy istnieją systematyczne związki pomiędzy użyciem pewnych słów a konkretnymi rysunkami, mogłoby się okazać ważnym krokiem naprzód. Książka zawiera kilka rodzajów ilustracji: kąpiące się kobiety i dzieci, rośliny i zioła, gwiazdy. Nietrudno byłoby ustalić słowa, które pasują do poszczególnych kategorii, mierząc ich odległość od obrazów. Można byłoby wtedy ustalić, że pewne słowa odnoszą się do konkretnych elementów graficznych, ale ciągle trudno byłoby powiedzieć, czy słowo pojawiające się często obok wizerunku rośliny to jej nazwa, czy określenie rzeczy jakoś z nią powiązanej. Kolejna analiza powinna połączyć poziom językowy z ilustracjami, chociaż wątpię, czy ktokolwiek będzie w stanie pójść jeszcze dalej.

 

T.A.: Niektóre rysunki z Manuskryptu przypominają mi styl Hieronima Boscha.

M.M.: Książka prawdopodobnie pochodzi z północnych Włoch i powstała wcześniej niż obraz Boscha, ale czasowo i geograficznie oba dzieła są sobie na tyle bliskie, że mogły podlegać podobnym wpływom kulturowym.

T.A.: Według części uczonych Manuskrypt to bełkot, który został spreparowany dla pieniędzy.

M.M.: Tak zakłada m.in. teoria proponowana przez Gordona Rugga, tyle że mówi ona o wielu nieprawdopodobnych zdarzeniach odległych o sto lat od rzeczywistej daty powstania Manuskryptu. Myślę więc, że spreparowanie czegoś tak skomplikowanego tylko dla pieniędzy jest niemal niemożliwe. Wymagałoby to bardzo wyrafinowanych sposobów, których nikomu nie opłacałoby się wymyślać.

T.A.: Wielu badaczy zwraca uwagę, że w tekście nie ma żadnych poprawek, a rysunki zawierają detale w mikroskali, które były nieznane przed XVIII wiekiem. Autor był geniuszem?

M.M.: Nie jestem przekonany, że do poznania takich szczegółów potrzebny jest mikroskop. Trzeba być ostrożnym, dostaję maile od ludzi, którzy dostrzegają w Manuskrypcie właściwie wszystko. To prawda, że nie ma tam poprawek, ale sam ich brak nie oznacza ani geniuszu, ani oszustwa. Ktoś mógł przecież przygotować wcześniej szkic.

T.A.: Wspomniał pan, że analiza Manuskryptu może się przydać w przyszłości. Do czego?

M.M.: Studiowanie sztucznych języków i porównywanie ich z naturalnymi może nauczyć nas wiele o uniwersalnych sposobach komunikacji. Chociaż nie ma dowodów na to, że znajomość struktury takich języków mogłaby pomóc w tworzeniu nowych, to nie przekonamy się o tym, dopóki nie zbadamy ich więcej. Chcę znaleźć te aspekty, które dotyczą wszystkich języków; zamierzamy też ulepszyć naszą metodę tak, żeby mniej tekstu wystarczało do ich przeanalizowania. Kto wie, może kiedyś będziemy mogli odcyfrować dzięki temu wiele starożytnych tekstów, które na razie są zbyt krótkie, żeby mogły zostać odczytane.

SZTUCZNY JĘZYK WILKINSA

Około 1664 roku, a więc 200 lat po powstaniu Manuskryptu Wojnicza, John Wilkins, angielski duchowny, zaczął prace nad uniwersalnym naukowym językiem. Zgodnie z jego koncepcją każde słowo miało być jednocześnie swoją własną definicją. Wilkins podzielił cały znany sobie Wszechświat na czterdzieści klas, z których każda dzieliła się dalej na subkategorie, te z kolei na gatunki. Każdej z klas filozof przypisał dwuliterową monosylabę, podklasom spółgłoski, każdemu gatunkowi zaś – samogłoskę.

Na przykład sylaba „de” miała oznaczać żywioł, a słowo „deb” to ogień, pierwszy z żywiołów. Podobny język stworzył w 1850 roku Letellier. „A” oznacza w nim zwierzę, „ab” to ssak, „abo” to mięsożerca. „Aboj” oznacza zwierzę z gatunku kotowatych, zaś domowy kociak nazywa się „aboje”. Z samej nazwy konia, „abiv”, wynika, że jest on „abi” – roślinożercą. Dzięki zastosowaniu takiej metody język, w którym każda litera ma znaczenie, staje się nie tylko środkiem przekazu informacji, ale również encyklopedią. Pewne cechy Manuskryptu Wojnicza wskazują, że ambicją jego autora mogło być stworzenie podobnego języka.

Marcelo Montemurro –  Argentyński fizyk teoretyczny pracujący na Uniwersytecie w Manchesterze. Razem z Damianem Zanette opublikował ostatnio analizę statystyczną języka tzw. Manuskryptu Wojnicza z XV wieku, słynnej średniowiecznej książki, która do dzisiaj pozostaje nierozszyfrowana. Opracowana przez Montemurro i Zanette metoda może pomóc w odcyfrowaniu wielu innych niezrozumiałych języków.