Šachové myšlení (8) - Haš funkce

Minule jsme si ukázali, jak zrychlit propočet šachového programu pomocí hašování. Dnes dojde na konkrétní implementaci hašovací funkce, která ke každé pozici na šachovnici přiřadí celé nezáporné číslo.

25.9.2009 00:00 | Jan Němec | přečteno 10608×

Před třemi lety jsem zde psal a nedokončil seriál o šachovém programování. Všem, kteří tak dlouho vydrželi čekat na další díl (díky několika e-mailům vím, že i takoví se našli) děkuji za přízeň a omlouvám se za zdržení.

Haš funkce

Je známý fakt, že několik různých posloupností tahů v propočtu šachového programu může vést ke stejné pozici. Je zbytečné tuto pozici vyhodnocovat několikrát. Velmi přirozenou myšlenkou je ukládat hodnoty propočítaných podstromů z jednotlivých navštívených pozic do nějaké datové struktury a vždy před začátkem vyhodnocování pozice se prostě této struktury nejprve zeptat, zda v ní už daná pozice není. Minule jsme si ukázali, že použitou datovou strukturou může být hašovací tabulka v céčkovském poli velikosti n, kde data pro pozice P jsou na indexu F(P) % n. Vlastní data mají 8 bytů a kromě hodnoty, hloubky propočtu a příznaku se pro kontrolu ukládá ještě hodnota druhé hašovací funkce G(P). To všechno už známe z minulého dílu, zbývá pouze ukázat, jak konkrétně naimplementovat funkce F a G tedy funkce, které každé pozici přiřadí nějaké čtyřbytové číslo.

Než se pustíme do definic, je dobré si rozmyslet, co po funkcích F a G budeme a co nebudeme vlastně potřebovat.

Všimněte si, že díky druhému požadavku zřejmě bude muset funkce záviset na celé šachovnici, což je zdánlivě v rozporu s požadavkem prvním. Jak si hned ukážeme, naštěstí je to v rozporu jen zdánlivě.

Definice haš funkce

Šachovnice má 64 polí a na každém z nich může být jeden ze 6 druhů kamenů obou barev a nebo volno, celkem tedy 13 možností. Na začátku programu si definujeme dvourozměrné pole 64 x 13 čtyřbytových čísel a vyplníme ho náhodným generátorem. Bude to pole koeficientů pro funkci F. Funkci G budeme počítat stejně, pouze bude mít vlastní pole 64 x 13 s jinými náhodnými hodnotami. Pozici netvoří jen rozložení kamenů na šachovnici, ale také informace o zkažených rošádách (pokud král nebo příslušná věž táhli, nelze již provést rošádu ani když jsou obě figurky zpět na výchozích polích), možnost braní mimochodem (brát mimochodem lze jen těsně poté, co soupeř táhl pěšcem o dva) a informace o tom, kdo je právě na tahu. I pro tyto jevy si nadefinujeme náhodná čísla.

Můžeme se na to dívat i tak, že máme 64 + 3 (počet políček na šachovnici + rošády, mimochodem a právo tahu) různých jevů a každý z těchto jevů má přiřazené nějaké náhodné číslo. Hašovací funkce F a G spočítáme prostě tak, že příslušná číslo spolu po jednotlivých bitech vyxorujeme. Pro méně zkušené programátory bych připomenul, že v jazyku C se pro XOR používá operátor ^ a místo a = a ^ b můžeme psát zkráceně a ^= b. Operátor bitový XOR (tedy ^) aplikuje logický XOR (česky popsatelný jako buď a nebo b, ale ne obě možnosti) na jednotlivé bity operandů podle následující tabulky:

XOR
x01
001
110

Pokud prázdné pole a černé i bílé kameny reprezentujeme hodnotami 0 až 12, zkažené rošády jedním číslem s nastavenými spodními 4 bity (malá bílá, velká bílá, malá černá a velká černá rošáda, proto 4) a právo braní mimochodem číslem od 0 do 8 podle sloupce, kde lze brát, a 0 znamená, že brát nelze, může být výpočet takto jednoduchý:

u32 nahodaSachovnice[64][13];/* náhodná čísla pro kameny na šachovnici */
u32 nahodaZkazeneRosady[16]; /* celkem 2^(počet rošád) = 2^4 = 16 možností */
u32 nahodaMimochodem[9];     /* 8 sloupců + 1 (nelze brát) = 9 možností braní mimochodem */
u32 nahodaBily;              /* kdo je na tahu */

u32 F(const u8 *sachovnice, int rosady, int mimochodem, int bily) {
  u32 vysledek = 0;
  int i;

  for (i = 0; i < 64; i++) {
    vysledek ^= nahodaSachovnice[i][sachovnice[i]];
  }
  vysledek ^= nahodaZkazeneRosady[rosady];
  vysledek ^= nahodaMimochodem[mimochodem];
  if (bily) vysledek ^= nahodaBily;

  return vysledek;
}

Díky funkci XOR výsledek závisí na všech polích šachovnice, drobná změna na jediném poli nebo v jiné vlastnosti pozice (braní mimochodem a podobně) způsobí, že výsledek bude vyxorován s jedním úplně jiným číslem a tedy úplně jiný. Díky tomu bude funkce F rozhazovat hodnoty pozic rovnoměrně do celé haš tabulky a kontrolní funkce G používající jinou sadu náhodných čísel bude mít úplně jiné kolize. Myslím, že idea hašování objektu pomocí náhodných čísel a funkce XOR je zajímavá a mohla by se v nějaké zcela odlišné úloze hodit i programátorům, kteří se nikdy šachům věnovat nebudou.

Zrychlení výpočtu

Funkce F a G už jsou definovány správně, ale máme ještě jeden problém a tím je efektivita výpočtu. Funkci budeme volat v každém navštíveném uzlu stromu propočtu včetně listů. Musíme ušetřit každou instrukci. Bohužel ve výpočtu je cyklus přes celou šachovnici a to si nemůžeme dovolit. Naštěstí máme funkce definované pomocí XOR a to je asociativní tj. (A XOR B) XOR C = A XOR (B XOR C), komutativní tj. A XOR B = B XOR A a navíc platí A XOR B XOR B = A. Díky tomu může funkci počítat i inkrementálně. To v podstatě znamená, že podle výše uvedeného kusu kódu spočítáme F a G jen jednou a to na začátku propočtu. Dejme tomu, že program má vymyslet první tah bílého ze základního postavení. Spočítá si tedy F a G pro základní postavení a dejme tomu, že v propočtu zkoumá variantu 1. Jf3 tedy tah jezdcem z g1 na f3. Udělá to následovně:

  vysledek = hodnota_F_pro_zakladni_postaveni;
  vysledek ^= nahodaSachovnice[G1][PRAZDNE_POLE];
  vysledek ^= nahodaSachovnice[G1][BILY_JEZDEC];
  vysledek ^= nahodaSachovnice[F3][PRAZDNE_POLE];
  vysledek ^= nahodaSachovnice[F3][BILY_JEZDEC];
  vysledek ^= nahodaBily;

Tedy zaxorují se jenom odlišnosti. Díky tomu, že XOR je samo vůči sobě inverzní operací, nemusíme ani myslet na to, která vlastnost tahem Jf3 nastává a která se ruší. Kdybychom funkce F a G místo na XOR vystavěli například na + (+ tak jak se běžně počítá na procesoru tj. modulová aritmetika se zahazováním bitů které se nevejdou do typu výsledku), museli bychom rušené jevy (zde Jg1 a nic na f3) místo sčítání odečítat a nastávající (zde nic na g1 a Jf3) přičítat. Zároveň je vidět, že bychom mohli náš výpočet s XORem trochu urychlit, pokud bychom pro prázdná políčka místo náhodných čísel použili natvrdo nuly. V příkladu s tahem Jf3 bychom místo s 5 XORy vystačili se třemi.

Pokračování příště

Příští díl bude o něco techničtější. Řekneme si něco o tom, jak reprezentovat pozici, jak generovat a ukládat tahy a podobně. To všechno jsou věci, které by každý zkušený programátor jistě nějak zvládl, ale existuje celá řada technik a drobných fíglů, které nejsou zcela bezprostřední a mohou ušetřit hodně času jak programátorovi, tak i jeho šachovému programu.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1648