MySQL (19) - Řadíme data

Kromě vybírání dat je rovněž potřebujeme nějak rozumně řadit (a to nejenom podle abecedy). V dnešním díle seriálu o MySQL se podíváme, jak na to.

10.5.2005 15:00 | Petr Zajíc | přečteno 78525×

Data mohou být do databáze vkládána v nahodilém pořadí. Často je však potřebujeme prezentovat v nějaké setříděné formě. Je jasné, že MySQL na to musí mít nějaké nástroje. A my je dnes prozkoumáme.

Klauzule ORDER BY

Příkaz SELECT může být následován klauzulí ORDER BY, která zajistí seřazení výsledné množiny záznamů podle nějakého výrazu. Tím "nějakým výrazem" je nejčastěji hodnota polí ve sloupci, ale jak ještě uvidíme, nemusí to tak být vždy. Řadit můžeme nejen podle čísel, ale i podle datumů (databáze si poradí s lahůdkami typu přechodných roků), a samozřejmě podle řetězců.

Tip.: Řetězce se porovnávají způsobem, který je definován při tvorbě tabulky pomocí slova collate. Jestliže žádné řazení nedefinujete, bývá pro řetězce použito výchozí řazení databáze, případně serveru. Je to častým námětem diskusí a ještě o tom bude řeč.

Jestliže je požadováno jak filtrování, tak i řazení, musí být klauzule WHERE uvedena před klauzulí ORDER BY. Následuje několik příkladů:

select * from faktury order by datum;
select * from knihy where cena >= 500 order by nazev;

Další příklady ukazují pro jistotu i nesprávnou syntaxi:

select * from faktury orderby datum;
select * from knihy order by nazev where cena >= 500;

V prvním případě jsem vynechal mezeru mezi "order" a "by". Ta mezera tam skutečně musí být. To se vám může v zápalu psaní stát docela často. Ve druhém případě jsem umístil řazení před filtrování (to se vám moc často stávat nebude; příkaz SELECT je totiž přes svoji složitost poměrně intuitivní).

Řazení podle více sloupců, vzestupné a sestupné

Často budete potřebovat řadit ne podle jednoho sloupce, ale podle více údajů najednou. Například budete chtít faktury seřadit podle data vydání a faktury se stejným datem vystavení ještě podle ceny. Není to žádný problém, když si uvědomíte, že ORDER BY může přijímat seznam výrazů. Řadí pak zleva doprava. Náš příklad bychom tedy mohli napsat asi takhle:

select * from faktury order by datum, cena;

Řazení podle více sloupců je samozřejmě časově náročnější než řazení podle jednoho sloupce; v praxi se to však používá docela často. Všechna řazení, o nichž jsme zatím mluvili, byla vzestupná. To znamená, že čísla se řadila od menších k větším, události v čase od starších k novějším a řetězce od A do Z. Často ale můžeme potřebovat opačnou věc. Tak třeba bezpečnostní protokol uložený v databázi můžeme chtít seřadit od nejnovějších událostí ke starším. Není to problém. Stačí uvést směr řazení pomocí klíčového slova DESC (descending = sestupně):

select * from protokol order by datum desc;

Existuje i klauzule ASC (ascending = vzestupně); jestliže se nepoužije, program ji dosadí automaticky. Při řazení podle více sloupců lze samozřejmě kombinovat, takže následující zápis je správný a udělá to, co má:

select jmeno, prijmeni, datum_nastupu from zamestnanci
order by datum nastupu desc, prijmeni asc, jmeno;

Tipy a triky s řazením záznamů

Uvádění slupců čísly

Při práci s databází se snadno můžeme dostat do situace, kdy potřebujeme řadit podle určitého sloupce ve výsledné sadě záznamů, přičemž neznáme předem jeho název. Například můžete chtít napsat obecnou proceduru, která seřadí dodanou sadu podle prvního sloupce. MySQL to umí - stačí místo názvu sloupce v klauzuli ORDER BY uvést jeho pořadové číslo. Takže například následující zápisy jsou rovnocenné:

select id, cislo, datum from smlouvy order by datum;
select id, cislo, datum from smlouvy order by 3;

Ale pozor - v kombinaci s "hvězdičkovým" příkazem SELECT to může být poměrně ošemetné. Chcete li řadit například podle třetího sloupce a zároveň nemáte ani ponětí, v jakém pořadí databáze vrátí sloupce, pravděpodobně seřadíte data jinak, než jste zamýšleli.

Výjimky v řazení

Následující věc nejlépe vysvětlím na příkladu: Dejme tomu, že budete chtít seřadit jednotlivé státy na světě (a třeba je poskytnout webové aplikaci jako podklady pro formulář):

create table staty(nazev varchar (30));
insert into staty values ('Andorra');
...
insert into staty values ('Česká republika');
...
insert into staty values ('Slovenská republika');
...
insert into staty values ('Zambie');

Asi na to půjdete takto:

select nazev from staty order by nazev;

Jenomže časem za vámi přijde šéf a bude chtít, abyste na začátek seznamu dali ČR, pak SR a zbytek už podle abecedy. Je to jednoduché, pokud si uvědomíme, že součástí klauzule ORDER BY může být i výraz:

SELECT * FROM staty order by (nazev='Česká republika') DESC,
(nazev='Slovenská republika') DESC, nazev

Nejprve budeme řadit podle logického výrazu "je to Česká republika?", pak totéž pro Slovensko a zbytek podle abecedy. Protože však chceme, aby ČR a SR byly nahoře a protože logická jednička se řadí POD logickou nulu, musíme v prvních dvou případech řadit sestupně. Celý výraz by se pochopitelně dal přepsat pomocí predikátu IN.

Řazení v cílové aplikaci

Až na malé výjimky byste se měli bránit řazení v cílových aplikacích a měli byste nechat řadit MySQL. Důvodem je fakt, že řazení data v databázích prošlo dlouhým vývojem a je silně optimalizováno. Bude tak v naprosté většině případů mnohem rychlejší než cokoli, co byste snad vymysleli sami. Pokud je databáze na jiném (a typicky silnějším) stroji než aplikace, je to o důvod navíc nechat všechnu "špinavou práci" s řazením na MySQL.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=826