MySQL (21) - klauzule JOIN

Dnes si ukážeme, jak lze efektivně v MySQL spojit tabulky.

20.5.2005 06:00 | Petr Zajíc | přečteno 106128×

V předchozím díle seriálu jsme si ukázali, jak lze jednoduše spojit tabulky pomocí jejich vyjmenování v příkazu SELECT a šikovně napsané klauzule WHERE. Není to však jediný způsob, jak něco takového provést, a není to ani moc často používané. Dnes si ukážeme, jak to celé dělat efektivněji. Nejprve ovšem zase trocha teorie.

Typy spojení

Vnitřní spojení

Situaci, kterou jsme popisovali v minulém díle se v databázovém světě říká vnitřní spojení (anglicky inner join). Připomeňme si, že šlo o úlohu, kde se měly vybrat knihy a jejich druhy (žánry) v aplikaci představující fiktivní evidenci knihovny:

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id;

Toto spojení je nazýváno vnitřní, protože jsou zobrazena pouze data, která si v obou tabulkách přesně odpovídají. Jinými slovy, knihy bez uvedeného žánru se ve výsledné sadě záznamů nikdy neobjeví, protože podmínka where to zkrátka neumožňuje. Vnitřní spojení se dá jinak (a používá se to mnohem častěji) přepsat v MySQL následujícícm způsobem:

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner join druhy on knihy.druh = druhy.id;

Pozn.: Klíčové slovo inner se smí vynechat, takže se často setkáte se zápisem from [název tabuky] join [název tabulky].

Jestliže by dotaz vyžadoval jak spojení tabulek, tak i nějakou omezující podmínku (případně řazení), klauzule FROM ... INNER bude v dotazu jako první, potom následuje podmínka WHERE a nakonec řazení. To bychom si měli jistě ukázat na nějakém příkladu:

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner join druhy on knihy.druh = druhy.id
where druhy.nazev='detektivky' order by knihy.nazev;

Vnitřní spojení se používají všude tam, kde potřebujeme mít data omezená na záznamy totožné v obou tabulkách. Co však, jestliže by v našem příkladu nějaká kniha neměla zadaný žánr, a my bychom ji přesto chtěli ve výsledné sadě záznamů mít? Zkusme třeba do naší knihovničky vložit následující data:

insert into knihy (nazev) values ('kniha bez žánru');

Pro zopakování - tato kniha má zadán pouze název, takže MySQL do dalších polí v tomto záznamu doplní výchozí hodnoty. V tabulce knih existují ještě další dvě pole - "id" a "druh". Do pole "id" doplní databázový stroj nejbližší vyšší číslo (nejspíš pětku, protože zatím jsme měli 4 knihy), a do pole "druh" dá hodnotu NULL, protože jsme toto pole neurčili a hodnoty NULL v tomto sloupci smí být.

V takovém případě bychom museli při zobrazování sáhnout po trochu jiné konstrukci.

Vnější spojení

Nejprve si můžete zkusit použít trik z minulého dílu; nakonec ale zjistíte, že na úlohy tohoto typu to zkrátka nestačí. Například následující příkaz nebude fungovat tak, jak bychom potřebovali:

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id or knihy.druh is null;

Abychom zahrnuli všechny knihy s jejich žánry a zároveň knihy, které žádný žánr nemají, k tomu máme v MySQL klauzuli LEFT JOIN (případně RIGHT JOIN). Napsat by se to dalo asi takto:

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy left join druhy on knihy.druh = druhy.id;

Všimněte si, že od původního příkazu s JOIN se tento liší pouze uvedením slova LEFT. Toto kouzelné slovíčko má za následek, že se zahrnou všechna data z tabulky knih, a z tabulky druhů (žánrů) se zahrnou pouze související data. Ve sloupcích, v nichž "párová" data v související tabulce nejsou budou vloženy hodnoty NULL.

Vnější spojení mohou být "levá" nebo "pravá". Funkčně se ničím neliší. Mohli bychom tedy náš dotaz přepsat do této podoby (a vrátil by totéž):

select knihy.id, knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from druhy right join knihy on knihy.druh = druhy.id;

De facto bychom si vystačili buď jen s levým, nebo jen s pravým spojením. Ale nezapomeňme, že pomocí klauzule JOIN lze spojit více než dvě tabulky. Pak může být možnost použít "levé" nebo "pravé" spojení k nezaplacení, neb můžeme tabulky vyjmenovávat v pořadí, v jakém se nám to hodí.

Vícenásobná spojení

Jak již jsme uvedli, lze spojit více než dvě tabulky. Přitom není nutné, aby byly všechny tabulky spojeny pomocí vnitřního (nebo vnějšího spojení). Je například možné spojit dvě tabulky pomocí vnitřního spojení a třetí připojit pomocí spojení vnějšího. Mohlo by to vypadat nějak takto:

select hlavicka_faktury.*, polozky_faktury.*, zakaznik.nazev
from hlavicky_faktury inner join polozky_faktury on hlavicka_fatkury.id = polozky_faktury.hlavicka
left join zakaznik on faktura.zakaznik = zakaznik.id;

V minulosti toho bylo hodně napsáno o tom, v jakém pořadí se mají jednotlivé spojované tabulky v příkazu uvádět. V dobách databázového pravěku totiž vykonával stroj spojení tupě zleva doprava. V poslední době je to jedno - DBMS mají takzvané optimizátory, které v naprosté většině případů dokáží spolehlivě odhadnout, v jakém pořadí tabulky spojit, aby byl výsledek poskytnut volající aplikaci co možná nejrychleji.

Význam spojení

Uvědomme si, že relační databáze jsou na spojování šikovně navržených tabulek postaveny. Je tedy nesmírně důležité dobře si osvojit syntaxi spojení a pokud možno se naučit psát příslušný kód z hlavy. Vizuální nástroje, které umožňují modelovat spojení pomocí klikání myší bez znalostí odpovídajícího kódu jsou sice poměrně produktivní, ale často si takový databázový programátor zvykne a zpohodlní. Má-li potom odladit nějaký dotaz BEZ grafických nástrojů, je to problém.

O dalších věcech souvisejících se spojeními budeme mluvit v příštím díle našeho seriálu.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=837