MySQL (7) - hrátky s čísly

Další trocha databázové teorie MySQL, dnes o ukládání čísel.

22.3.2005 15:00 | Petr Zajíc | přečteno 59911×

V předešlém díle jsme uvedli některé základní věci, které byste měli znát při ukládání řetězců do databáze MySQL. Dnes se podíváme na to, jak MySQL ukládá čísla. Uvidíte, že s tím může být docela zábava.

MySQL a celá čísla

Z programátorských důvodů existuje celá řada datových typů, do nichž lze v MySQL uložit celá čísla. Liší se zejména tím, jak velká čísla může takový sloupec pojmout. Nejmenším celočíselným typem je TINYINT, který může nabývat hodnot od -128 do +127, včetně. V praxi jej zřejmě moc často nepoužijete, leda snad pro uložení čísel, které zkrátka nikdy větší nebudou (například den v týdnu). Pro TINYINT je v databázi potřeba jen jeden bajt místa.

SMALLINT je již rozsahem větší a bude se tedy používat mnohem častěji. Uloží celá čísla od -32 768 do +32 767. S oblibou jej nasazuji třebas v účetních programech na číslování dokladů, málokdo má totiž víc než 32767 dokladů v účetním roce. SMALLINT zabírá v databázi dva bajty.

Potom má MySQL k dispozici datový typ MEDIUMINT. Slouží pro uložení čísel od -8 388 608 do 8 388 607 (to je +-2^23). V databázi zabírá tři bajty a nemůžu si na něj zvyknout. Ono ve skutečnosti typu MEDIUMINT nic není, jen se v některých DBMS systémech nevyskytuje a tak ho nemám v krvi. Dokážu si ale docela dobře představit, že by se na spoustě míst dal použít místo typu INTEGER, o němž je řeč níže. Tak třeba automatická čísla řádků by klidně mohla být MEDIUMINT, protože obvykle stačí dimenzovat tabulku na osm milionů řádků.

Datový typ INTEGER je naopak databázová klasika. Lze jej zkráceně deklarovat jako INT a pojme celá čísla v rozpětí od -2 147 483 648 do 2 147 483 647. Typicky se používá pro údaje sloužící k číslování řádků, protože pro většinu aplikací jsou dvě miliardy řádků v jedná tabulce víc než dost. INTEGER zabere v databázi 4 bajty místa.

MySQL však jde ještě dál a "umí" uložit i větší celá čísla. Typ BIGINT je schopen pracovat s numery od -9 223 372 036 854 775 808 do 9 223 372 036 854 775 807. Tak veliké číslo ani neumím přečíst ;-). Nenapadá mě žádný důvod, proč by v praxi musel programátor sáhnout k používání něčeho tak obrovského. Snad jen na nějaké vědeckotechnické výpočty. V manuálu je navíc popsáno, že práce s tímto datovým typem přináší určitá úskalí, takže pokud jej musíte používat, nastudujte to.

Celá čísla bez znaménka

Aby to s těmi čísly nebylo tak jednoduché, dodejme ještě, že MySQL umožňuje použít v definici čísla klauzuli UNSIGNED ("bez znaménka"). To způsobí, že se v daném typu budou skladovat pouze nezáporná čísla. "Ušetřený" bajt se pak použije na zvýšení rozsahu čísla. Nejlépe se to dá pochopit na příkladu: TINYINT pojme čísla od -127 do +128, TINYINT UNSIGNED od 0 do 255. Neboli, stále se jedná o interval zahrnující 256 čísel, jsou však "posunuta" tak, aby začínala nulou.

Tip: K automatickému číslování řádků se obyčejně používají kladná čísla (ačkoli to principielně není nutné). Dokážu si tedy představit pro sloupec s automatickým číslem například použití typu MEDIUMINT UNSIGNED, což mi dává rozsah od nuly do 16 777 215.

Nepřesná desetinná čísla

Existují dva datové typy, které se v MySQL používají pro uložení nepřesných desetinných čísel. Proč nepřesných? Protože při uložení čísel v takovém případě dojde k jejich zaokrouhlení. Datové typy FLOAT a DOUBLE se liší víceméně jen zobrazovaným rozsahem a počtem desetinných míst. Rozsahy nebudu uvádět; jsou obrovské a jsou v manuálu.

Se zaokrouhlováním čísel typu FLOAT a DOUBLE je ale docela zábava. Představte si například, že chcete do sloupce FLOAT a DOUBLE uložit výsledek výpočtu "pět děleno třemi". Jak pravděpodobně víte, výsledkem je číslo s nekonečným periodickým rozvojem a v databázi to dopadne tak, že se do sloupce typu float uloží 1.66667 a do sloupce typu double 1.66666666666667.

Naštěstí můžete přesnost uložení trochu ovlivnit. U FLOAT a DOUBLE můžete při jejich definici zadat požadovaný počet desetinných míst, například FLOAT (10,5) nebo DOUBLE (20,10). Uvedené příklady znamenají to, že:

Z toho, co bylo řečeno asi tušíte, že s nepřesnými desetinnými čísly je docela potíž. Moje rada je: nepoužívejte je, pokud vysloveně nemusíte. Rozhodně je nepoužívejte na uložení takových věcí, jako je množství zboží ve faktuře nebo kupříkladu sazba DPH. Početními operacemi s nepřesnými čísly se totiž zaokrouhlovací chyby kumulují. Rvněž bídně selže pokus nepřesná čísla nějak porovnávat nebo použít jako zákad pro spojení. Když už musíte tato čísla porovnávat, použijte nějaké intervaly. Takže namísto myšlenky typu:

jestliže [nepřesné číslo] = 10000 tak ...

použijte (pokud opravdu musíte) něco ve smyslu

jestliže [nepřesné číslo] >= 9999.9 a [nepřesné číslo] <= 10000.1 tak ...

je to ale poměrně otravné (a pomalé). Daleko lepší je používat přesná desetinná čísla.

Přesná desetinná čísla

Existuje MySQL datový typ DECIMAL, který ukládá desetinná čísla s pevnou čárkou. Deklaruje se jako DECIMAL (x,y), přičemž o parametrech platí to, co bylo řečeno výše u typů FLOAT a DOUBLE. Protože ukládá vnitřně čísla jako řetězec, netrpí chybami při zaokrouhlování. S výhodou se používá pro uložení peněžních hodnot; některé DBMS mají dokonce definován typ MONEY, který odpovídá DECIMAL (x,4).

Rozhodně doporučuji používat DECIMAL všude tam, kde se jedná o peněžní hodnoty (například, v účetních programech) nebo o přesně stanovitelné zlomky (třeba "půl kila hřebíků"). Teto typ je sice teoreticky pomalejší než nepřesná čísla, ale konec potíží se zaokrouhlováním za to ve většině případů stojí.

U všech typů desetinných čísel (přesných i nepřesných) můžete použít příznak UNSIGNED. Jen pozor, funguje to jinak než u čísel celých. Stane se to, že do sloupce nepůjdou uložit záporné hodnoty, ale rozsah kladných hodnot, které sloupec pojme se nezvýší.

Překročení rozsahu

Upřímě řečeno mi způsob, jakým se MySQL chová při překročení rozsahu sloupce vůbec nevyhovuje. Jestliže se totiž například do pole, kam má být uložen TINYINT pokusíme vložit číslo mimo rozsah, příkaz NESELŽE, vyvolá varování, a vloží NEJBLIŽÍ povolenou hodnotu (v případě TINYINT tedy hodnotu 128). Ve většině případů tedy nepůjde při práci s MySQL spoléhat na to, že při práci s čísly mimo rozsah skončí operace chybou a bude se to moci nějak řešit. Pamatujte na to; toto chování vede k tomu, že v databázi můžete mít hodnoty, které jste tam nezadali!

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=768