|
|
nepresnosti, nesmysly
|
13.5.2004 03:43
Jan Houštěk
|
> zalozeny na metode vypracovane anglickym matematikem
> Tomasem Bayesem
Ten matematik se nejmenoval Tomáš, ale Thomas, a rozhodne nevypracoval zadnou metodu pro detekci spamu. Je po nem pojmenovan pouze vzorec pro vypocet podminene pravdepodobnosti, ktere se v nejprimitivnejsich statistickych filtrech pouziva (nutno podotknout, ze vetsina soucasnych filtru pouziva podstatne sofistikovanejsi model, takze by se jim spravne ani nemelo rikat "bayesovske").
Dale me zarazila metoda, kdy se filter naucil tisice cizich spamu, ale nenasel jsem zadnou zminku o tom, ze by se do nej pridalo take alespon radove srovnatelne mnozstvi hamu. Aby statisticky filter dobre fungoval, musi byt corpus spamu a hamu vyvazeny a zdaleka neplati, ze cim vice mailu je zauceno, tim lepe. |
|
|
Re: nepresnosti, nesmysly
|
13.5.2004 08:20
Jan Houštěk
|
Navic samotny Bayesuv vzorec je tvrzeni, ktere je intuitivne zrejme, a fundamentalne je na urovni axiomatiky, takze z zadneho pohledu nejde o nic objevneho. Zjednodusene to tvrdi, ze kdyz na kostce sestka padne s pravdepodobnosti 1/6, tak za predpokladu, ze padlo sude cislo (s p = 1/2) je sance na sestku rovna 1/3. |
|
|
Bayes
|
21.5.2004 17:35
Jakub Hegenbart
|
Já tedy nevím, Bayes samozřejmě přispěl především podmíněnou pravděpodobností, ale později byl vyvinut statistický klasifikátor na základě podmíněné pravděpodobnosti a byl na jeho počest pojmenovám po něm. Takže mi připadá, že Bayesovská filtrace je pojmenována podle toho klasifikátoru, ne? |
|
|
|
|
KOMENTARZE
|
Tylko zarejestrowani użytkownicy mogą dopisywać komentarze.
|
|
Szukanie oprogramowania
|
©Pavel Kysilka - 2003-2024 |
maillinuxsoft.cz | Design:
www.megadesign.cz
|