Dnes se podíváme na to, jak nám práci s databází MySQL může usnadnit systémový katalog. Řeč tedy bude o metadatech.
23.12.2005 06:00 | Petr Zajíc | přečteno 17681×
Když jsme v seriálu probírali ty důležité změny, které přináší MySQL
5.0, přece jen jsme něco vynechali. Hovořili jsme o uložených
procedurách, spouštích, uživatelsky definovaných funkcích a pohledech.
"Pětka" má však ještě další významnou novinku, a tou je systémový
katalog.
Pro systémový katalog se běžně používá několik vzájemně se
překrývajících termínů. Proto v této souvislosti můžete slyšet výrazy
jako databázová metadata (database metadata), datový slovník (data
dictionary) nebo systémový katalog (system catalog). Pokaždé se však
jedná o to samé - metadata popisují strukturu samotné databáze. Proto
se pojem metadata vysvětluje jako "data o datech".
Celá myšlenka metadat spočívá v tom, že údaje o jednotlivých
databázích, tabulkách, sloupcích, indexech, uložených procedurách a tak
dále jsou uloženy na jednom místě. Asi už tušíte kde - jsou uložena v
samostatné databázi. Tato logika implementující sama sebe má svoji
výhodu - uvědomte si, že mezi databázemi, tabulkami a sloupci jsou
vlastně relační vztahy. Není tedy nic jednoduššího, než na uložení
metadat použít stejný způsob jako na uložení samotných dat.
Myšlenka metadat pochopitelně není nová a MySQL není jediná
databáze, která obsahuje systémový katalog. Ve skutečnosti téměř každá
soudobá databáze nějaký ten katalog obsahuje. Koho to zajímá, pro toho
můžeme uvést, že informační schéma je rovněž součástí SQL standardu
ANSI/ISO SQL:2003.
Už jsme uvedli, že katalog je reprezentován databází. A v MySQL je
touto databází information_schema. Protože je systémový katalog v MySQL
až od verze 5.0, je pochopitelně i tato databáze přítomna až od verze
5.0. Krátký pohled na tuto databázi nám objasní, co všechno obsahuje:
Celý katalog si pochopitelně databázový server obhospodařuje sám. To
znamená, že informační bude žít svým vlastním životem, aniž byste se o
ni museli nějakým způsobem starat. V praxi to vypadá tak, že když
provedete nějaký ten definiční příkaz (dejme tomu CREATE TABLE), tak se
v databázi nejen vytvoří potřebná tabulka, ale rovněž se do katalogu
zapíší všechna metadata.
Manuál k MySQL podrobně popisuje,
jaká je struktura jednotlivých tabulek v informační databázi a rovněž
poskytuje příklady toho, jak tyto informace smysluplně použít. My se za
chvíli podíváme na některé praktické příklady.
Důležitá věc: Informační databáze slouží pouze k prohlížení,
nemůžete do ní zapisovat. Všechny změny v databázi je tedy potřeba
dělat pomocí definičních příkazů. Stojí rovněž za zmínku, že některé
tabulky v informační databázi fyzicky neexistují, jsou pouze virtuální.
Jak bystrý čtenář usoudí, je pro ně použit typ tabulky MEMORY.
Přístup do systémového katalogu rovněž může být upraven pomocí
oprávnění uživatelů.
Protože jsou metadata v tabulkách, lze s nimi pracovat pomocí příkazu SELECT. To znamená, že je můžeme seskupovat, třídit, spojovat, filtrovat a podobně. Jestliže tedy budu chtít znát názvy všech tabulek v databázi test, mohu použít něco ve smyslu:
select * from tables
where table_schema = 'test'
V praxi používám systémový katalog na několik věcí. Především, je třeba si uvědomit, že katalog obsahuje zdrojový kód všech uložených procedur a pohledů, takže pokud jsem někde ztratil zdrojový kód procedury, není nic jednoduššího než přepnout se do informační databáze a napsat:
select routine_name,
routine_definition from routines;
A kódy procedur jsou na světě. Druhá věc, na níž metadata používám je zjišťování údajů o sloupcích. Tak například sloupec typu varchar má zcela jistě definovánu nějakou maximální délku řetězce, kterou do něj lze uložit. Tuto délku asi budete chtít znát pro případnou kontrolu, zda uživatel nezadal více dat, než je zdrávo. Kýžený údaj se dozvíte takto (použil jsem zjišťování údajů o tabulce z minulého dílu seriálu):
select column_name,
character_maximum_length from columns
where table_name = 'lidi' and data_type='varchar';
Pozn.: Tohle má mnoho využití. Ve
webových formulářích například často budete sbírat údaje od uživatelů s
pomocí prvků typu TEXT nebo TEXTAREA. Pokud se mají údaje uložit do
databáze, bude jen žádoucí zkontrolovat jejich délku.
A třetí věc, na níž používám metadata je tvorba "automatických" kusů
kódu. Obecně se dá říci, že databázový software trpí častým opakováním
kódu. Vybíráte data z rozevíracích seznamů, zobrazujete tabulky na
základě sad záznamů a tak dále. Používané kódy se často podobají jeden
druhému jako vejce vejci, a rozdíl bývá jen v textech dotazů
získávajících data. Do aplikace však většinou není třeba nic "natvrdo"
zadávat - postačí pár šikovných dotazů na metadata a univerzální
rozhraní pro zobrazení prakticky čehokoliv je na světě.
Metadata se dají pužít i k mnoha dalším věcem. Můžete například
snadno zjistit, která tabulka ve vaší databázi má nejvíce sloupců nebo
která nemá primární klíč. Platí samozřejmě, že výhody systémového
katalogu jsou tím zřejmější, čím větší databázi máte. Nic se nesmí
přehánět; pokud vaše databáze obsahuje dvě tabulky, nejspíš se bez
služeb katalogu obejdete.
V MySQL 4 sice katalog není k dispozici, ale částečně jej nahrazuje sada příkazů show. Tak například informace o sloupcích tabulky lidi můžete zobrazit pomocí něčeho jako:
show full columns from
lidi;
Není to sice zdaleka tak pružné jako použití systémového katalogu,
ale v mnoha případech to bohatě postačí.
Katalog je v MySQL až od verze 5.0. Což znamená, že až dosud se vývojáři museli obejít bez něj a byli tak nuceni používat příkazy SHOW TABLES, SHOW DATABASES a podobně. Protože dotazy na metadata nebývají stežejními částmi aplikací, pravděpodobně se příkazy SHOW nebudou s nástupem "pětky" masivně předělávat; spíše při vývoji nových věcí bude možné použít namísto toho katalog. Neboli - nakládání s metadaty je třeba znát, ale svět na tom nestojí.