V předchozím díle seriálu jsme si ukázali,
jak lze jednoduše spojit tabulky pomocí jejich vyjmenování v příkazu
SELECT a šikovně napsané klauzule WHERE. Není to však jediný způsob,
jak něco takového provést, a není to ani moc často používané. Dnes si
ukážeme, jak to celé dělat efektivněji. Nejprve ovšem zase trocha
teorie.
Typy spojení
Vnitřní spojení
Situaci, kterou jsme popisovali v minulém díle se v databázovém
světě říká vnitřní spojení (anglicky inner join). Připomeňme si, že šlo
o úlohu, kde se měly vybrat knihy a jejich druhy (žánry) v aplikaci
představující fiktivní evidenci knihovny:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id;
Toto spojení je nazýváno vnitřní, protože jsou zobrazena pouze data,
která si v obou tabulkách přesně odpovídají. Jinými slovy, knihy bez
uvedeného žánru se ve výsledné sadě záznamů nikdy neobjeví, protože
podmínka where to zkrátka neumožňuje. Vnitřní spojení se dá jinak (a
používá se to mnohem častěji) přepsat v MySQL následujícícm způsobem:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner
join druhy on knihy.druh = druhy.id;
Pozn.: Klíčové slovo inner se smí
vynechat, takže se často setkáte se zápisem from [název tabuky] join
[název tabulky].
Jestliže by dotaz vyžadoval jak spojení tabulek, tak i nějakou
omezující podmínku (případně řazení), klauzule FROM ... INNER bude v
dotazu jako první, potom následuje podmínka WHERE a nakonec řazení. To
bychom si měli jistě ukázat na nějakém příkladu:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner
join druhy on knihy.druh = druhy.id
where druhy.nazev='detektivky' order by knihy.nazev;
Vnitřní spojení se používají všude tam, kde potřebujeme mít data
omezená na záznamy totožné v obou tabulkách. Co však, jestliže by v
našem příkladu nějaká kniha neměla zadaný žánr, a my bychom ji přesto
chtěli ve výsledné sadě záznamů mít? Zkusme třeba do naší
knihovničky vložit následující data:
insert into knihy
(nazev) values ('kniha bez žánru');
Pro zopakování - tato kniha má zadán pouze název, takže MySQL do
dalších polí v tomto záznamu doplní výchozí hodnoty. V tabulce knih
existují ještě další dvě pole - "id" a "druh". Do pole "id" doplní
databázový stroj nejbližší vyšší číslo (nejspíš pětku, protože zatím
jsme měli 4 knihy), a do pole "druh" dá hodnotu NULL,
protože jsme toto pole neurčili a hodnoty NULL v tomto sloupci smí být.
V takovém případě bychom museli při zobrazování sáhnout po trochu
jiné konstrukci.
Vnější spojení
Nejprve si můžete zkusit použít trik z minulého dílu; nakonec ale
zjistíte, že na úlohy tohoto typu to zkrátka nestačí. Například
následující příkaz nebude fungovat tak, jak bychom potřebovali:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id or
knihy.druh is null;
Abychom zahrnuli všechny knihy s jejich žánry a zároveň knihy, které
žádný žánr nemají, k tomu máme v MySQL klauzuli LEFT JOIN (případně
RIGHT JOIN). Napsat by se to dalo asi takto:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy left join
druhy on knihy.druh = druhy.id;
Všimněte si, že od původního příkazu s JOIN se tento liší pouze
uvedením slova LEFT. Toto kouzelné slovíčko má za následek, že se
zahrnou všechna data z tabulky knih, a z tabulky druhů (žánrů) se
zahrnou pouze související data. Ve sloupcích, v nichž "párová" data v
související tabulce nejsou budou vloženy hodnoty NULL.
Vnější spojení mohou být "levá" nebo "pravá". Funkčně se ničím
neliší. Mohli bychom tedy náš dotaz přepsat do této podoby (a vrátil by
totéž):
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from druhy right
join knihy on knihy.druh = druhy.id;
De facto bychom si vystačili buď jen s levým, nebo jen s pravým
spojením. Ale nezapomeňme, že pomocí klauzule JOIN lze spojit více než
dvě tabulky. Pak může být možnost použít "levé" nebo "pravé" spojení k
nezaplacení, neb můžeme tabulky vyjmenovávat v pořadí, v jakém se nám
to hodí.
Vícenásobná spojení
Jak již jsme uvedli, lze spojit více než dvě tabulky. Přitom není
nutné, aby byly všechny tabulky spojeny pomocí vnitřního (nebo vnějšího
spojení). Je například možné spojit dvě tabulky pomocí vnitřního
spojení a třetí připojit pomocí spojení vnějšího. Mohlo by to vypadat
nějak takto:
select
hlavicka_faktury.*, polozky_faktury.*, zakaznik.nazev
from hlavicky_faktury inner join
polozky_faktury on hlavicka_fatkury.id = polozky_faktury.hlavicka
left join zakaznik on
faktura.zakaznik = zakaznik.id;
V minulosti toho bylo hodně napsáno o tom, v jakém pořadí se mají
jednotlivé spojované tabulky v příkazu uvádět. V dobách databázového
pravěku totiž vykonával stroj spojení tupě zleva doprava. V poslední
době je to jedno - DBMS mají takzvané optimizátory, které v naprosté
většině případů dokáží spolehlivě odhadnout, v jakém pořadí tabulky
spojit, aby byl výsledek poskytnut volající aplikaci co možná
nejrychleji.
Význam spojení
Uvědomme si, že relační databáze jsou na spojování šikovně
navržených tabulek postaveny. Je tedy nesmírně důležité dobře si
osvojit syntaxi spojení a pokud možno se naučit psát příslušný kód z
hlavy. Vizuální nástroje, které umožňují modelovat spojení pomocí
klikání myší bez znalostí odpovídajícího kódu jsou sice poměrně
produktivní, ale často si takový databázový programátor zvykne a
zpohodlní. Má-li potom odladit nějaký dotaz BEZ grafických nástrojů, je
to problém.
O dalších věcech souvisejících se spojeními budeme mluvit v příštím
díle našeho seriálu.