Jak zkombinovat kód PHP a MySQL tak, abychom dosáhli co nejrychlejšího zpracování?
27.8.2004 15:00 | Petr Zajíc | přečteno 46503×
Proč se zabývat rychlostí provádění PHP a MySQL kódu? Webové i
databázové servery bývají povětšinou silně "nadupané" stroje. Takže by
se mohlo zdát, že rychlost provádění PHP kódu nebo rychlost, s jakou je
databáze schopna vrátit požadované výsledky není až tak kritická otázka
(kolega říká, že "železo to utlačí"). Není to samozřejmě úplně tak
pravda; webový server možná bude muset obsloužit tisíce požadavků a
rozdíl mezi skriptem běžícím vteřinu a skriptem běžícím pět vteřin bude
vražedný.
Další důvod proč se zabývat již při psaní kódu rychlostí je ten, že
si tak osvojíme některé programátorské návyky, a to se vždy hodí.
Takže, níže bude seznam věcí, na které bychom měli při psaní kódu z
hlediska rychlosti pamatovat.
Pozn.: Databázoví virtuosové znají
celou řadu dalších triků zvyšujících rychlost. Na toto téma se píší
celé knihy, takže si tento článek nijak neklade za cíl probrat všechno.
Pokud znáte další věci, podělte se s námi v diskusi.
Z logiky věci vyplývá, že čím menší bude objem zpracovávaných informací, tím lépe. Máme-li například vypsat jména a příjmení z tabulky pracovníků, můžeme použít jeden ze dvou následujících SELECTů:
SELECT * FROM pracovnici
SELECT jmeno, prijmeni FROM pracovnici
Správný je ten druhý přístup. Jelikož SELECT * vrací všechny sloupce
a tabulka pracovníků se může časem rozrůst o další sloupce, vracel by
první příkaz zbytečně mnoho záznamů. V příkazu SELECT tedy
VYJMENOVÁVEJTE SLOUPCE.
To, co platí o sloupcích platí i o řádcích. Většinou nebudete
potřebovat najednou zpracovávat tisíce záznamů. Můžete použít klauzule
WHERE nebo LIMIT a počet vrácených záznamů tak omezit na rozumnou míru.
To jsme si ukázali v díle o zobrazování
a stránkování dat.
To bych měl asi trochu vysvětlit. Možná si vzpomenete na díl, který vyhledává obce podle PSČ. Klíčový příkaz celé aplikace tehdy byl:
<?$vysledek=mysql_query("select * from psc where
psc=".$_POST["psc"]);?>
V praxi bychom asi chtěli data vrátit seřazená podle abecedy. Takže odpovídající příkaz by se změnil na:
<?$vysledek=mysql_query("select * from psc where
psc=".$_POST["psc"]." order by obec");?>
Možná jste si ale také všimli, že data byla v příkladu u tohoto dílu
řazena podle abecedy i bez použití klauzule ORDER BY. To není žádná
alchymie, prostě jsem jen data importoval již seřazená. Takový trik
půjde použít zejména u tabulek určených jen pro čtení a ty se ve
webových aplikacích objevují dost často. Je jasné, že když se databáze
nebude muset starat o řazení výsledné sady, provede svou práci rychleji.
Agregační funkce umožňují zpracovat celé skupiny dat a vrátit jenom výsledky. Například - který ze dvou následujících kódů proběhne rychleji?
<?
$vysledek=mysql_query("select count(*) as
pocet from psc");
$zaznam=mysql_fetch_array($vysledek);
$celkem=$zaznam["pocet"];
?>
anebo
<?
$vysledek=mysql_query("select * from psc");
$celkem=mysql_num_rows($vysledek);
?>
Je jasné, že nechat proběhnout dlouhý dotaz jen proto, abychom
zjistili, kolik je v tabulce řádků je krajně neekonomické. První dotaz
proběhne rychleji, protože databáze bude muset vrátit pouze jedno číslo.
Pozn.: Pokud bychom pro výslednou sadu měli okamžité využití, bude to pochopitelně naopak.
Někdy bývá zvykem před zobrazením dat z databáze ještě cosi dopočítávat pomocí PHP. Tak například aplikace by mohla získat z databáze cenu výrobku bez DPH a cenovou hladinu DPH a PHP by mohlo dopočítat cenu s daní, nějak takhle:
<?$vysledek=mysql_query("select cena, dph from
zbozi");
while ($zaznam=MySQL_Fetch_Array($vysledek)):?>
<TR>
<TD><?echo $zaznam["cena"]?></TD>
<TD><?echo $zaznam["dph"]?></TD>
<TD><?echo $zaznam["cena"]*$zaznam["dph"]?></TD>
</TR>
<?endwhile;?>
v takovém případě musí PHP pronásobit cenu a daň pro každou položku. Většinou bývá neskonale rychlejší nechat to udělat databázi, nějak takto:
<?$vysledek=mysql_query("select cena, dph,
cena*dph as sdani from zbozi");
while ($zaznam=MySQL_Fetch_Array($vysledek)):?>
<TR>
<TD><?echo $zaznam["cena"]?></TD>
<TD><?echo $zaznam["dph"]?></TD>
<TD><?echo $zaznam["sdani"]?></TD>
</TR>
<?endwhile;?>
To proto, že databáze byla na rychlé vrácení dat silně
optimalizována již při své výrobě a pronásobení "ve střevech" provede
nejspíš rychleji než PHP.
V dalším díle se podíváme, jak k optimalizaci práce s daty poslouží perzistentní spojení, nebufferované dotazy, indexy a optimalizace tabulky. Takže se máte na co těšit.