MySQL (22) - tipy a triky ke spojování tabulek
Netradiční zápisy spojení a úvaha nad rychlostí spojování tabulek - to je téma dnešního dílu seriálu o MySQL.
27.5.2005 09:00 |
Petr Zajíc
| Články autora
| přečteno 66088×
Dnes si rozebereme některé věci, které se týkají spojování tabulek a
které byste měli znát. Nebo takové, o nichž byste měli alespoň tušit,
že existují. Spojování tabulek je totiž tak v databázovém světě tak
důležité, že se bez něj v naprosté většině aplikací zkrátka neobejdete.
Exotická spojení
Na těchto typech spojení je exotické to, že je většina vývojářů nebo
projektů téměř nepoužívají. Na jednu stranu se nepoužívají proto, že k
tomu není důvod, na druhou stranu je dobré o nich vědět. Takže, která
spojení to jsou?
CROSS JOIN
CROSS JOIN spojí tabulky tak, že výsledkem je jejich kartézský
součin. To znamená, že pro každý řádek z jedné tabulky je ve výsledné
sadě záznamů vytvořena kombinace se všemi řádky z tabulky druhé. Má-li
tedy první tabulka 5 řádků a druhá 2 řadky, bude ve výsledné množině
řádků deset. CROSS JOIN tabulky knih a druhů bychom mohli zapsat takto:
select * from knihy
cross join druhy;
Třebaže se to nezdá, s tímto příkazem jsme se již v seriálu setkali,
a to v jiné formě v díle o základech
spojování. On je totiž předchozí příklad ekvivalentní zápisu
select * from knihy,
druhy;
a abychom byli politicky korektní, je rovněž významem roven zápisu
select * from knihy join
druhy;
Sady vrácené pomocí CROSS JOIN bývají málokdy tak smysluplné, aby je
šlo v reálných aplikacích nějak použít. Typickou chybou pro začátečníky
v oblasti spojování tabulek je vytvoření příkazu CROSS JOIN a následné
"vyzobávání" potřebných záznamů pomocí klauzule WHERE nebo pomocí
procházení výsledné sady záznamů. V praxi bývá většinou na místě
použití INNER JOIN nebo LEFT JOIN.
Jako obecná zásada tedy může sloužit tvrzení, že používáte-li CROSS
JOIN, pak nejspíš máte pomalé databázové aplikace, špatný návrh
struktury databáze nebo obojí.
NATURAL JOIN
Takže, nejprve definice: NATURAL JOIN (a NATURAL LEFT JOIN) je roven
takovému příkazu JOIN (a LEFT JOIN), kde jsou použity všechny sloupce z
obou tabulek, které se stejně jmenují. Tahle věcička patří k těm, které
se rozhodnete milovat nebo nenávidě, ale nic mezi tím. NATURAL JOIN se
pochopitelně dá vždy přepsat jako odpovídající JOIN. Uveďme
ale příklad, jak by takové spojení mohlo vypadat:
select * from knihy
natural join druhy;
Pokud si to zkoušíte, zjistíte, že tento dotaz nevrátí pro naše
tabulky žádná data. Proč? Podívejte se na strukturu tabulek! Která pole
se jmenují stejně? ID a název - a neexistuje záznam, v němž by byly v
našem příkladu shodné. Přiznám se, že patřím k těm, kdo NATURAL JOIN
moc v
lásce nemají. Pokud byste chtěli vědět proč, tady jsou moje důvody:
- Z pohledu na zápis spojení pomocí NATURAL JOIN nepoznám, co dělá
- Již fungující příkaz mohu elegantně zbořit tím, že do tabulky
někdy v budoucnosti přidám nějaká pole (které bude shodou okolností
existovat i v druhé tabulce)
- Nevyhovuje to mým konvencím pro tvorbu tabulek. Například všechny
primární klíče pojmenovávám id, a tím se vlastně ochuzuji o možnost
NATURAL JOIN použít
Pozn.: Ten poslední bod je samozřejmě
vyvratitelný. Nic by mi nebránilo nazvat si v tabulce druhů sloupec s
primárním klíčem třebas druh_id. Kdybych pak v tabulce knih rovněž
odkazující sloupec nazval druh_id, NATURAL JOIN by se dal použít a
určitá koncepce pojmenování tabulek by taky zůstala. Nicméně, zvyk je
železná košile.
Uvědomme si, že NATURAL JOIN použije pro spojení všechna shodná
pole. O něco elegantnější je následující konstrukce.
JOIN ... USING
Toto rozšíření funguje tak, že sice rovněž spojuje pomocí shodně
nazvaných polí v obou tabulkách, ale umožňuje nám tato pole vyjmenovat.
Kdybychom v našem příkladu měli skutečně pole zastupující žánr knihy
nazváno druh_id, mohli bychom příkaz
select * from knihy join
druhy on knihy.druh_id = druhy.druh_id;
přepsat použitím JOIN ... USING na
select * from knihy join
druhy using (druh_id);
Jak vidíte, tím padají všechny moje argumenty ohledně
nepoužitelnosti NATURAL JOIN, protože tento zápis spojení je celkem
přehledný a dá se použít. Nicméně, stále to vyžaduje mít odpovídající
pole ve spojovaných tabulkách nazvána stejně. Pochopitelně, že lze
rovněž použít zápis LEFT JOIN ... USING a RIGHT JOIN ... USING.
Rychlost spojení
Zaznamenal jsem některé dotazy v diskusi nebo e-mailech, které
souvisely s výkonem spojení. Pokusím se teď na ně odpovědět.
Je rozdíl mezi LEFT JOIN a RIGHT JOIN v rychlosti?
Ne, manuál
k mysql na stránce o optimalizaci spojení tvrdí, že "RIGHT JOIN je
imlementováno analogicky k LEFT JOIN s tím, že role obou tabulek jsou
prohozeny". Nemusíte se tedy bát. Skutečně není nutné vyměňovat v
zápisu spojení tabulky jen proto, abychom dosáhli zvýšení rychlosti.
Musím spojit více tabulek. Nebude to pomalé?
V naprosté většině případů bude spojení
více tabulek stejně to nejrychlejší možné řešení. Ostatní možnosti
(například, uložení jednoho spojení do dočasné tabulky a její použití
při dalším spojení) budou až řádově pomalejší.
Čeho bych se měl vyvarovat při spojování tabulek? Co naopak použít?
První věcí, kterou je třeba zmínit jsou indexy. V seriálu o nich
bude teprve řeč, takže vydržte. Měli byste zvážit použití indexu pro
spojení, protože toto spojení pak může být mnohem rychlejší. Druhá věc
- a tu můžeme uvést hned - měli byste se pokud možno vyhýbat použití
čehokoli jiného kromě názvu sloupců v definici spojení. Například
následující spojení je sice syntakticky správné a MySQL jej provede.
select * from
zamestnanec join pozice on zamestnanec.pozice = pozice.id+3;
Protože však je součástí spojovací podmínky výraz (pozice.id+3),
nemůže nebohá databáze provést žádnou optimalizaci a bude zřejmě při
sestavování spojení muset procházet tabulkou "pozice".
Verze pro tisk
|
Příspívat do diskuze mohou pouze registrovaní uživatelé.
|
|

Vyhledávání software

Vyhledávání článků
28.11.2018 23:56 /František Kučera Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1
12.11.2018 21:28 /Redakce Linuxsoft.cz 22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář
6.11.2018 2:04 /František Kučera Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
4.10.2018 21:30 /Ondřej Čečák LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář
18.9.2018 23:30 /František Kučera Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
9.9.2018 14:15 /Redakce Linuxsoft.cz 20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business.
Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář
12.8.2018 16:58 /František Kučera Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář
16.7.2018 1:05 /František Kučera Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář
Více ...
Přidat zprávičku
 Poslední diskuze
31.7.2023 14:13 /
Linda Graham iPhone Services
30.11.2022 9:32 /
Kyle McDermott Hosting download unavailable
13.12.2018 10:57 /
Jan Mareš Re: zavináč
2.12.2018 23:56 /
František Kučera Sraz
5.10.2018 17:12 /
Jakub Kuljovsky Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?
Více ...
|