PHP (33) - HTTP hlavičky

PHP a HTTP protokol - jelikož PHP slouží převážně k výrobě internetových stránek, není vůbec špatné vědět, jak funguje jejich přenos a jaké triky nám jazyk nabízí v této oblasti.

4.8.2004 15:00 | Petr Zajíc | přečteno 71344×

Hlavičky požadavku

Aby se ve světě internetu udržel nějaký pořádek, musí existovat určitá pravidla hry. Tak například webové servery musejí "rozumět" tomu, na co se jich ptáme. Aby to dovedly, existuje protokol, který se jmenuje HTTP. Každý prohlížeč musí umět sestavit takzvaný http požadavek a musí být schopen porozuměnt http odpovědi. (Každý server zase musí rozumět požadavku a musí být schopen sestavit podle něj odpověď.) V praxi to velice zhruba řečeno funguje tak, že jak požadavky, tak odpovědi mají svůj formát a ten by se měl ctít a dodržovat.

Požadavek se skládá mimo jiné z hlaviček. Ty mohou obsahovat některé důležité věci o tazateli (tedy prohlížeči) nebo o jeho prostředí. PHP umí zjistit, jaké hlavičky byly v požadavku, a umí je zobrazit. Slouží k tomu příkaz getallheaders a funguje to následujícím způsobem:

<?
$hlavicky
= getallheaders();
while (list (
$nazev, $hodnota) = each ($hlavicky)) {
   echo
"$nazev: $hodnota<br>\n";
}
?>

Jelikož má generování hlaviček na starosti prohlížeč, bude pravděpodobně výstup skriptu pro každý prohlížeč jiný. Hlavičky požadavku nemají až tak velký význam, ale mohou být užitečné pro statistiky a podobně. (Často z nich jde vyvěštit, jaký prohlížeč jsme pro zobrazení stránky použili).

Hlavičky odpovědi

U odpovědí je situace veselejší. Tu sestavujeme sami a můžeme na to využít PHP. Odpověď webového serveru má dvě části:

Hlavička se do odpovědi propašuje pomocí PHP funkce header. My už jsme se s touto funkcí v seriálu setkali na dvou místech. V díle o příkladech na formuláře jsme využili hlavičku Location a v díle o uploadu a downloadu souborů jsme využili dokonce tři hlavičky, content-description, content-type a content-disposition. Teď si v tom uděláme trochu jasno.

Z čistě praktického hlediska není přidání hlavičky k odpovědi nic jiného, než způsob, jak něco vzkázat prohlížeči. Hlavičky jsou normalizované, hotové peklo však může nastat při zjišťování, zda nám cílový prohlížeč opravdu porozuměl a zda udělal to, co chceme.

Co se týče PHP, musí být všechna volání funkce header provedena dříve, než se odešle jakýkoli výstup do prohlížeče. Poměrně častá chyba vznikne tehdy, když máme projekt uložený ve více souborech a ty spojujeme pomocí require nebo include. I jedna nevinná mezera na konci includovaného souboru totiž způsobí, že se volání funkce header nepovede - a chybu možná budeme dlouho hledat.

Pozn.: To, co jsem řekl o hlavičkách berte jako nástin problematiky. Opravdoví znalci HTTP možná poukáží na to, že existují různé verze protokolu, že v každé verzi přibyly nebo ubyly určité hlavičky, že některé hlavičky začaly být od jisté verze HTTP povinné a podobně. Můžete se realizovat v diskusi.

Hlavičky v praxi

V praxi existuje jen několik hlaviček, které stojí za to si zapamatovat v souvislosti s PHP. Ukažme si je:

Location
Location se pokusí přemluvit prohlížeč, že by se měl poohlédnout jinde. Máte-li například stránku s následujícím obsahem:

<?
Header
("Location: http://www.linuxsoft.cz");
?>

Zkuste si to

budete místo jejího načtení přesměrováni na startovní stránku Linuxsoftu přesto (nebo možná právě proto ;-) ) že je skript naprosto v pořádku. Zbytek skriptu se zkrátka neprovede.

Content-disposition
je hlavička, která se pokusí přemluvit prohlížeč, aby to, co bude ve výstupu následovat, považoval za přílohu. Už jsme o ní mluvili.

<?
Header
("Content-Description: File Transfer");
Header("Content-Type: application/force-download");
Header("Content-Disposition: attachment; filename=\"nazev.pripona\"");
?>

Cache-control
Existuje sada hlaviček, které se pokusí přemluvit prohlížeč, aby se nebavil s proxy serverem, ale aby načetl vždy čerstvou kopii stránky ze serveru.

<?
Header
("Pragma: no-cache");
Header("Cache-control: no-cache");
Header("Expires: ".GMDate("D, d m Y H:i:s")." GMT");
?>

Pozn.: Kéžby to fungovalo vždy. Některé proxy servery bývají napsány tak, že je skoro nemožné je obejít, jiné je potřeba správně nastavit, další mají v rukou lidé, které nemůžete ovlivnit. Většinou to ale dopadne dobře a použití těchto hlaviček způsobí načtení stránky ze serveru, ne z cache proxy.

WWW-Authenticate
je hlavička, která se pokusí vysvětlit prohlížeči, že by měl požadovat ověření uživatele pomocí jména a hesla. Ještě o ní budeme mluvit podrobněji, teď jen příklad:

<?
Header
("HTTP/1.0 401 Unauthorized");
Header("WWW-Authenticate: Basic realm=\"oblast\"");
?>

Hlavičky nejsou samospásné. Prohlížeče některým nerozumí, jiné se používají nenormalizovaně, další pozmění nebo nepochopí na cestě číhající proxy server, prostě bývá s nimi zábava. Ty, které jsem uvedl výše by v naprosté většině případů měly fungovat správně.

Příště se v našem seriálu přehoupneme do oblasti, na kterou se již všichni těší - bude řeč o databázích.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=325