W części tej opisujemy w ogólnym zarysie przeprowadzoną analizę statystyczną. Aneks zawiera wszystkie szczegóły potrzebne czytelnikowi, który chciałby powtórzyć rachunki i zweryfikować ich poprawność. W razie potrzeby autorzy dostarczą (po pokryciu kosztów) dyskietki z użytym programem, a także teksty G, 7, R,T,U,ViW (por. część 3).
Mierzyliśmy statystyczną istotność zjawiska na wybranych parach skorelowanych wyrazów (takich jak młot-kowadło i Sedegasz-Mattaniasz). W tym celu musieliśmy:
(i) zdefiniować pojęcie „odległości” między dwoma wyrazami, tj. określić, co to znaczy, że dwa słowa leżą „blisko siebie”;
(ii) zdefiniować statystyki pozwalające ustalić, jak blisko leżą „na ogół” słowa w próbie badanych par (chodzi o ustalenie średniej bliskości dla całej próby);
(iii) wybrać próbę par skorelowanych słów, na której zostaną przeprowadzone testy;
(iv) ustalić, czy dla wybranej próby statystyki (ii) dają „szczególnie małe” wyniki.
Krok (i) rozkłada się na kilka czynności. Po pierwsze, musimy zdefiniować „odległość” między dwoma ELS w obrębie jednej tablicy; w tym celu posługujemy się odpowiednim wariantem zwykłej metryki euklidesowej. Po drugie, ponieważ istnieje wiele sposobów zapisania danego tekstu w postaci dwuwymiarowej tablicy, zależnie od wybranej długości wierszy musimy posłużyć się jedną lub więcej tablicami i umieć zagregować otrzymane wyniki (oczywiście wybór rozmiaru tablicy i/lub agregacja wyników cząstkowych musi następować podług ustalonych i konsekwentnie przestrzeganych reguł). Po trzecie, dane słowo może pojawiać się w tekście wielokrotnie jako ELS; i w tym przypadku niezbędne są procedury wyboru i scalenia wyników Po czwarte, należy wprowadzić poprawki na długość słowa i jego układ. Wszystko to zostało szczegółowo opisane w częściach A.l i A. 2 Aneksu.
Należy zaznaczyć, że nasza definicja odległości nie jest jedyną możliwą. Chociaż każda definicja musi spełniać pewne ogólne wymogi (jak minimalizacja skoku cD, mogą one różnić się w szczegółach. Jednak nie wydaje się prawdopodobne, by fakt ten mógł zasadniczo wpłynąć na ostateczny wynik. Zdecydowaliśmy się na określoną definicję odległości, którą posługiwaliśmy się konsekwentnie: funkcja c (w, w'), opisana w części A.2 Aneksu, została zdefiniowana przed dokonaniem wyboru próby i nie była potem zmieniana. (Ife same uwagi dotyczą decyzji podejmowanych podczas realizacji punktu (ii)].
Kolejna czynność (ii) polegała na zmierzeniu przeciętnej bliskości par słów w całej próbie. W tym celu użyliśmy dwóch różnych statystyk Pi i Ich opis wraz z uzasadnieniem znajduje się w Aneksie (część A,5). W sensie intuicyjnym obie mierzą przeciętną bliskość, choć każda w inny sposób. W obu przypadkach mała wartość Pi oznacza, że słowa w wybranych parach leżą na ogół blisko siebie. Inne statystyki nie były obliczane — ani dla pierwszej, ani drugiej, ani żadnej innej próby
W kroku (iii), konstruując odpowiednią próbę par słów, staraliśmy się zachować konsekwentne i obiektywne reguły w odniesieniu do relacji między słowami w ramach poszczególnych par. Budując próbę posłużyliśmy się listą osób (p) oraz dat (hebrajski dzień i miesiąc) (p') ich śmierci lub urodzin, korzystając z Encyclopedia of Greaź Men in Israel [5].
Najpierw zastosowaliśmy proste kryterium selekcji, włączając do próby te osoby któiych encyklopedyczne hasło lic2yło co najmniej trzy kolumny tekstu i dla których można było określić datę narodzin lub śmierci. Otrzymaliśmy 34--osobową listę (por. lista pierwsza — tabela 1). Aby uniknąć ewentualnego posądzenia, że dopasowujemy testy do danych, zbadaliśmy też inną próbę, pozostawiając bez zmian wszystkie inne parametry Uwzględniliśmy w niej hasła osobowe
0 długości od 1,5 do 3 kolumn, otrzymując dalsze 32 osoby (por. lista druga — tabela 2). Tbst istotności został przeprowadzony jedynie na drugiej próbie.
Zauważmy, że paiy osoba-data (p, p') nie są parami słów. Poszczególne osoby bywają różnie określane, istnieją też różne pisownie i różne sposoby datowania. Tak więc każdej parze (p, p') odpowiada wiele par słów (w> w'). Szczegóły metody wygenerowania próby par słów z listy osób zawarte są w Aneksie (część A. 3).
Mierząc bliskość par słów (w, w') otrzymujemy statystyki Pi i P2. Zastosowaliśmy również (por. Aneks, część A.5) inny wariant tej metody, generujący mniejszą próbę z tej samej listy osób. Statystyki Pi i P2 zastosowane do tej mniejszej próby oznaczyliśmy P3 i P4.
Pozostał jeszcze krok (iv), tj. test istotności. Jest on tak łatwy i prosty, że możemy go opisać już teraz.
Druga lista składa się z 32 osób. Dla każdej z 32! permutacji k definiujemy statystykę P*, otrzymaną w wyniku ustawienia tych osób w kolejności n, tak że osobie i odpowiadają daty osoby n(i). Wszystkie 32! liczby P* szeregujemy, uwzględniając ewentualne powtórzenia, według zwykłej relacji mniejszości dla liczb rzeczywistych. Gdyby badane zjawisko miało charakter losowy, pojawienie się Pl na danym miejscu byłoby równie prawdopodobne jak na każdym innym z 32! miejsc. Podobnie jest dla P2, P3 i P4. Tb jest nasza hipoteza zerowa.
Dla obliczenia poziomów istotności wybraliśmy losowo 999 999 permutacji 32 imion; szczegółowa procedura opisana została w Aneksie (część A.6). Każda permu-tacja określa statystykę Pi, co razem z Pi , daje 1000 000 liczb. Zdefiniujmy rangę Pi wśród tych I 000 000 liczb jako ilość tych Pi, które są nie większe od Pi; jeśli Pi jest równe pewnym P?, połowę z nich uznajemy za „większe” od Pi. Oznaczmy przez pi rangę Pi podzieloną przez 1 000 000; zgodnie z hipotezą zerową, pi określa prawdopodobieństwo, że Pi będzie miało rangę tak niską, jak w rzeczywistości. Podobnie zdefiniujmy p2, p3
1 p4 (używając każdorazowo tych samych 999 999 permutacji).
Po obliczeniu prawdopodobieństw pi do p4 musimy podjąć ostateczną decyzję o przyjęciu bądź odrzuceniu hipotezy roboczej. Nie możemy przy tym zadowolić się tylko korzystnymi wynikami. Przypuśćmy na przykład, że p3 - 0,01, a inne pi są wyższe. Pojawia się pokusa, żeby posłużyć się jedynie ps, a więc odrzucić hipotezę zerową na poziomie 0,01. Ale byłoby to błędem; przy dostatecznie wielu statystykach jest całkiem możliwe, że przypadkiem jedna z nich okaże się niska. Prawidłowo postawione pytanie brzmi zatem: przyjmując hipotezę zerową, jakie jest prawdopodobieństwo, że co najmniej jedna z czterech wartości i będzie mniejsza łub równa 0,01? Czyli, jeśli oznaczymy przez Zi zdarzenie „p; < 0,01”, musimy znaleźć prawdopodobieństwo n i e Z3, ale „Zl lub Z2 lub Z3 lub Za\ Gdyby Zi wzajemnie się wykluczały, prawdopodobieństwo to wynosiłoby 0,04; koincydencja mogłaby je tylko obniżyć, więc w każdym przypadku będzie ono mniejsze lub równe 0,04. Możemy zatem odrzucić hipotezę zerową na poziomie 0,04, ale nie 0,01,
Ogólnie, dla każdego 5, prawdopodobieństwo, że co najmniej jedna z liczb p? będzie mniejsza łub równa 5, jest nie większe od 45. Jest to znana nierówność Bonferroniego. Ostatecznie, jeśli użyjemy wszystkich czterech statystyk, poziom istotności wyniesie po := 4 min p
Tabela 3 zawiera rangi każdego z czterech Pi pośród 1 000 000 odpowiadających im Zatem wartość 4 dla P4 oznacza, że dokładnie dla 3 z 999 999 losowych permutacji wartość statystyczna Pą była mniejsza od P4 (i żadna nie była jej równa). Wynika stąd, że min p; = 0,000004, czyli po = 4 min pi = 0,000016. Podobne rachunki, z użyciem tych samych 999 999 losowo wybranych permutacji, przeprowadzono na tekstach kontrolnych. Pierwszy tekst kontrolny R otrzymano przez losową permutację liter G (szczegóły w części A.6 Aneksu). Jeden z czytelników wcześniejszej wersji tego artykułu, wybitny uczony, zasugerował użycie jako tekstu kontrolnego Wojny i pokoju. Zastosowaliśmy więc naszą procedurę do tekstu T, jakim byl początkowy fragment o długości równej G dzieła Ibłstoja w przekładzie hebrajskim [6]. Następnie jeden z recenzentów poprosił o przeprowadzenie eksperymentu kontrolnego na jakimś wczesnohebraj-skim tekście. Zasugerował randomizację tekstu na dwa sposoby — całości i poszczególnych wersów Tak więc sprawdziliśmy teksty 7, U i W: tekst / to Księga Izajasza [2]; W otrzymaliśmy permutując losowo słowa G; U powstało z G przez losowe przestawienie słów w ramach wersetów. Poddaliśmy testowi także tekst V otrzymany z G przez losowe przestawienie wersetów (szczegóły w części A.6 Aneksu). Tabela 3 prezentuje wyniki tych testów W przypadku 7, min pi równe jest w przybliżeniu 0,900; w przypadku R wartość ta wynosi 0,365; dla T — 0,277; dla U — 0,276; dla V— 0,212; oraz dla W— 0,516. Thk więc w pięciu przypadkach po = = 4 min pi przekracza 1, a w jednym po -= 0,878; a więc wynik jest całkowicie nieistotny statystycznie, jak można się było spodziewać w przypadku tekstów kontrolnych.
Wyciągamy stąd wniosek, że bliskość powiązanych znaczeniowo ELS nie jest w Księdze Genesis dziełem przypadku.