wszystkich posunięć w danej partii, ale i rozmaitych sytuacji z innych rozgrywek. Im bogatszym materiałem dysponowała maszyna, tym łatwiej znajdowała analogie i podejmowała słuszne decyzje. Program uwzględniający konieczność uczenia się w czasie gry Samuel opracował w 1955 r., a publiczny pokaz w telewizji amerykańskiej (luty 1956 r.) wzbudził niemałą sensację. Gra toczyła się ze zmiennym szczęściem, a jej poziom był wysoki. Zaprogramowanie maszyny było co prawda dość kłopotliwe i zmuszało do stosowania pamięci o dużych pojemnościach, ale dzięki temu komputer mógł sam się doskonalić, śledząc mistrzowskie walki na turniejach i zalecenia z podręczników.
W ośrodku IBM, gdzie pracował Samuel, maszyna za dnia wykonywała normalne obliczenia. W nocy, kiedy wszyscy szli do domu, komputer studiował historię warcabów i walczył sam z sobą. Każdą rozegraną przez siebie partię maszyna mogła prześledzić, oceniając własne zaawansowanie w stosunku do wybitnych graczy. Umożliwiał to umieszczony w programie współczynnik korelacji
C = (L-H) (L+H)
przy czym L oznacza liczbę ruchów uznanych za gorsze niż posunięcia mistrza, a H — liczbę ruchów, w których decyzja maszyny była lepsza.
W następnej kolejności, zamiast uczyć maszynę setek szczegółowych rozgrywek, zaczęto układać programy, dzięki którym, na podstawie doświadczeń, maszyna mogła wyciągać bardziej generalne wnioski. Zdobywanie wiedzy przez uogólnianie wydatnie zmniejszyło niezbędne rozmiary pamięci oraz uczyniło maszynę szybszą i bardziej efektywną, zwłaszcza w środkowej fazie gry, która wymaga dużej samodzielności decyzji. Odbiło się to jednak
30