Co se skrývá za zkratkou SQL a co z toho pro nás vyplývá. Ach, ty normy.
15.3.2005 15:00 | Petr Zajíc | přečteno 46675×
V předchozím díle jsme narazili na pojem SQL. Pojďme se dnes podívat
podrobněji na to, co se za tímto označením skrývá, a jakými peripetiemi
prošel tento jazyk během svého vývoje.
SQL je jazyk, kterým databázoví klienti komunikují z databázovým serverem. Údajně pochází jeho předek, který se jmenoval Sequel (Structured English Query Language), již z roku 1974 a vyvinuli jej inženýři IBM v Jan Jose, Kalifornii. Záměrem bylo vytvořit takový jazyk, který by se co nejvíce podobal běžné řeči. Kdybyste například chtěli vybrat z tabulky faktur záznamy z roku 2005, můžete v SQL napsat něco ve stylu:
SELECT * FROM FAKTURY
WHERE DATUM >= 1.ledna 2005
Nápad použít jazyk SQL, alespoň
principielně, začala postupně přebírat celá řada dalších firem a
zabudovávat jej
do svých databázových produktů. Tak například firma Relational
Software, Inc. (nyní Oracle), Ashton-Tate (dBASE IV), Informix, SyBase
a další. V roce 1986 byl SQL jazyk prvně standardizován díky skupině
ANSI. (Perlička: ANSI původně chtěla vyvinout vlastní standard na
základě zcela jiného jazyka, ale SQL se jaksi prosadil sám jakožto
rozšířenější - a byl přejat).
Vývoj však šel dál a v roce 1992 bylo SQL znovu revidováno. Standard
začal být znám jakožto SQL92 nebo SQL2. Původní definice z roku 86 byla
v té době rozšířena především o možnost definovat pomocí SQL primární
klíče a specifikace SQL92 řešila rovněž pravidla referenční integrity
(pokud vám tyto pojmy nic neříkají, nezoufejte. Až se k nim v seriálu
dostaneme, vysvětlím je).
Od té doby
již používají databáze převážně nějakou tu formu SQL. (Mimochodem, SQL
není omezena jen na relační databáze. Mohou ji používat a používají ji
i například databáze objektově-relační). Konečně, v roce
1999 byl přijat další standard, a to pod názvem SQL99 nebo také SQL3.
Jeho cílem bylo pochopitelně reagovat na vývoj v dané oblasti a SQL99
tak přináší do databázového jazyka objektová rozšíření. Mezi věci
definované v SQL99 patří například nové datové typy (large object,
boolean, array, row a uživatelsky definované typy), nové způsoby
spojování tabulek a nějaké ty prvky OLAP.
Pozn. OLAP je zkratka pro "online
analytic processing". Zahrnuje nástroje, které umožňují z dat efektivně
získávat nějaké smysluplné analytické informace - třeba pomocí jejich
seskupování. Často se v této souvislosti hovoří o "managerských"
informacích, protože potřebu efektivní analýzy si vyžádal zejména
prudký nárůst počtu databází v obchodních aplikacích.
Z předchozího oddílu by člověk snadno mohl nabýt dojem, že všechny
databáze budou nějakým způsobem jednotně komunikovat pomocí
standardizovaného jazyka. Bohužel, není tomu tak. Skutečnost je podobná
situaci, v níž se nachází jazyk HTML. V případě jazyka HTML byly
přijaty určité standardy, ale jednotlivé prohlížeče s nimi zacházejí
různě. Někdy prohlížeče neumějí správně zobrazit ani takové stránky,
které jsou podle normy korektní. Úplně stejně je na tom standard SQL.
Jednotlivé databáze se sice snaží implementovat normu, ale dochází
přitom k následujícím nepříjemným jevům:
To znamená jedno: Kód SQL je sice principielně přenositelný mezi jednotivými databázemi, v praxi to však většinou není pravda. Vývojáři aplikace tedy musejí vědět, s jakou databází budou pracovat.
Nemám samozřejmě nic proti rozšířením jazyka SQL. Konec konců to, co
bylo dříve považováno za módní výstřelek toho či onoho výrobce DBMS se
zvolna mění ve standard a bývá to časem zařazováno do normy. Rovněž je
dobré si uvědomit, že rozšíření SQL nevznikají proto, že by dodavatelé
neměli co dělat, ale proto, že si chtějí udržet zákazníky.
Problém je však s tou kompatibilitou. Výkon databázových systémů je často pro aplikace klíčový. Jednotlivá rozšíření standardu SQL vedou k tomu, že lze napsat kód jazyk SQL, který se bude rychleji vykonávat nebo se bude snadněji číst a spravovat. Proto odborníci na jednotlivé databáze tato rozšíření znají a používají. Praxe je tdy taková, že aby mohl být člověk databázovým specialistou, musí většinou
Databáze MySQL na svých stránkách lišácky uvádí: "Databáze MySQL
podporuje širokou podmnožinu syntaxe ANSI 99, společně s dalšími
rozšířeními, jako je příkaz REPLACE nebo klauzule LIMIT u příkazu
SELECT a DELETE. Jsou podporovány rovněž alternativní syntaxe známé z
jiných databázových systémů...Průběžně rozšiřujeme... verze 4.0
například přichází s podporou příkazu UNION". Otevřeně řečeno, MySQL si
s ostatními DBMS v ničem nezadá a chová se úplně stejně. Nemůžeme jí to
mít moc za zlé, je to přece jen dáno takovými faktory, jako je názor
zákazníků nebo tlak trhu.
V našm seriálu prostě přijmeme určité odchýlení od normy jako fakt.
Budu se snažit poukazovat na všechny možné syntaxe včetně
alternativních a nebudu příliš často moralizovat o tom, zda daná věc
plně odpovídá definici v normě. Je to dáno praxí - pokud budete vyvíjet
nějakou tu aplikaci, zákazníka bude zajímat především:
Zákazníky běžně nezajímá, jakými prostředky toho bude dosaženo.
Někdy je ponecháno na programátorovi i to, jaký programovací jazyk
použije nebo jakou nasadí pro uskladnění dat databázi. V příkladech
tedy budeme předpokládat, že nasazena je MySQL a budeme uvažovat, jak
dané problémy s pomocí této databáze co možná nejjednodušeji vyřešit.