Dnes si ukážeme, jak lze efektivně v MySQL spojit tabulky.
20.5.2005 06:00 | Petr Zajíc | přečteno 106128×
V předchozím díle seriálu jsme si ukázali, jak lze jednoduše spojit tabulky pomocí jejich vyjmenování v příkazu SELECT a šikovně napsané klauzule WHERE. Není to však jediný způsob, jak něco takového provést, a není to ani moc často používané. Dnes si ukážeme, jak to celé dělat efektivněji. Nejprve ovšem zase trocha teorie.
Situaci, kterou jsme popisovali v minulém díle se v databázovém světě říká vnitřní spojení (anglicky inner join). Připomeňme si, že šlo o úlohu, kde se měly vybrat knihy a jejich druhy (žánry) v aplikaci představující fiktivní evidenci knihovny:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id;
Toto spojení je nazýváno vnitřní, protože jsou zobrazena pouze data, která si v obou tabulkách přesně odpovídají. Jinými slovy, knihy bez uvedeného žánru se ve výsledné sadě záznamů nikdy neobjeví, protože podmínka where to zkrátka neumožňuje. Vnitřní spojení se dá jinak (a používá se to mnohem častěji) přepsat v MySQL následujícícm způsobem:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner
join druhy on knihy.druh = druhy.id;
Pozn.: Klíčové slovo inner se smí
vynechat, takže se často setkáte se zápisem from [název tabuky] join
[název tabulky].
Jestliže by dotaz vyžadoval jak spojení tabulek, tak i nějakou omezující podmínku (případně řazení), klauzule FROM ... INNER bude v dotazu jako první, potom následuje podmínka WHERE a nakonec řazení. To bychom si měli jistě ukázat na nějakém příkladu:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy inner
join druhy on knihy.druh = druhy.id
where druhy.nazev='detektivky' order by knihy.nazev;
Vnitřní spojení se používají všude tam, kde potřebujeme mít data omezená na záznamy totožné v obou tabulkách. Co však, jestliže by v našem příkladu nějaká kniha neměla zadaný žánr, a my bychom ji přesto chtěli ve výsledné sadě záznamů mít? Zkusme třeba do naší knihovničky vložit následující data:
insert into knihy
(nazev) values ('kniha bez žánru');
Pro zopakování - tato kniha má zadán pouze název, takže MySQL do
dalších polí v tomto záznamu doplní výchozí hodnoty. V tabulce knih
existují ještě další dvě pole - "id" a "druh". Do pole "id" doplní
databázový stroj nejbližší vyšší číslo (nejspíš pětku, protože zatím
jsme měli 4 knihy), a do pole "druh" dá hodnotu NULL,
protože jsme toto pole neurčili a hodnoty NULL v tomto sloupci smí být.
V takovém případě bychom museli při zobrazování sáhnout po trochu
jiné konstrukci.
Nejprve si můžete zkusit použít trik z minulého dílu; nakonec ale zjistíte, že na úlohy tohoto typu to zkrátka nestačí. Například následující příkaz nebude fungovat tak, jak bychom potřebovali:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy, druhy where knihy.druh = druhy.id or
knihy.druh is null;
Abychom zahrnuli všechny knihy s jejich žánry a zároveň knihy, které žádný žánr nemají, k tomu máme v MySQL klauzuli LEFT JOIN (případně RIGHT JOIN). Napsat by se to dalo asi takto:
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from knihy left join
druhy on knihy.druh = druhy.id;
Všimněte si, že od původního příkazu s JOIN se tento liší pouze
uvedením slova LEFT. Toto kouzelné slovíčko má za následek, že se
zahrnou všechna data z tabulky knih, a z tabulky druhů (žánrů) se
zahrnou pouze související data. Ve sloupcích, v nichž "párová" data v
související tabulce nejsou budou vloženy hodnoty NULL.
Vnější spojení mohou být "levá" nebo "pravá". Funkčně se ničím neliší. Mohli bychom tedy náš dotaz přepsat do této podoby (a vrátil by totéž):
select knihy.id,
knihy.nazev, druhy.nazev as druh,
max_doba_vypujcky from druhy right
join knihy on knihy.druh = druhy.id;
De facto bychom si vystačili buď jen s levým, nebo jen s pravým
spojením. Ale nezapomeňme, že pomocí klauzule JOIN lze spojit více než
dvě tabulky. Pak může být možnost použít "levé" nebo "pravé" spojení k
nezaplacení, neb můžeme tabulky vyjmenovávat v pořadí, v jakém se nám
to hodí.
Jak již jsme uvedli, lze spojit více než dvě tabulky. Přitom není nutné, aby byly všechny tabulky spojeny pomocí vnitřního (nebo vnějšího spojení). Je například možné spojit dvě tabulky pomocí vnitřního spojení a třetí připojit pomocí spojení vnějšího. Mohlo by to vypadat nějak takto:
select
hlavicka_faktury.*, polozky_faktury.*, zakaznik.nazev
from hlavicky_faktury inner join
polozky_faktury on hlavicka_fatkury.id = polozky_faktury.hlavicka
left join zakaznik on
faktura.zakaznik = zakaznik.id;
V minulosti toho bylo hodně napsáno o tom, v jakém pořadí se mají
jednotlivé spojované tabulky v příkazu uvádět. V dobách databázového
pravěku totiž vykonával stroj spojení tupě zleva doprava. V poslední
době je to jedno - DBMS mají takzvané optimizátory, které v naprosté
většině případů dokáží spolehlivě odhadnout, v jakém pořadí tabulky
spojit, aby byl výsledek poskytnut volající aplikaci co možná
nejrychleji.
Uvědomme si, že relační databáze jsou na spojování šikovně
navržených tabulek postaveny. Je tedy nesmírně důležité dobře si
osvojit syntaxi spojení a pokud možno se naučit psát příslušný kód z
hlavy. Vizuální nástroje, které umožňují modelovat spojení pomocí
klikání myší bez znalostí odpovídajícího kódu jsou sice poměrně
produktivní, ale často si takový databázový programátor zvykne a
zpohodlní. Má-li potom odladit nějaký dotaz BEZ grafických nástrojů, je
to problém.
O dalších věcech souvisejících se spojeními budeme mluvit v příštím díle našeho seriálu.