Programujeme s XML (16.) - Metody výstupu v XSLT

Ačkoli je výstupem XSLT transformace vždy fragment DOM stromu či série SAX událostí, můžeme ovlivnit, jakým způsobem bude tato struktura zapsána na výstupu, dnes se tedy podíváme, jaký je mezi jednotlivými způsoby rozdíl.

14.9.2004 15:00 | Aleš Hakl | přečteno 12296×

Jak již jsem v minulém dílu zmíníl, můžeme pomocí atributu method elementu xsl:output zvolit způsob výstupu, není v tom žádná magie, a ač to tak na první pohled nevypadá, jsou první dva způsoby v podstatě stejné a liší se jen drobnými detaily, zato výstupní metoda "text" je úplně o něčem jiném.

HTML

V tomto případě procesor upraví výstup tak, aby byl pokud možno validním HTML, to znamená, že negeneruje uzavírací tagy (</img>) ani prázdné elementy (<img/>) pro elementy, které jsou v HTML považovány za prázdné, nenahrazuje znaky <>"'& uvnitř elementů script a style a provádí ještě další podobné úpravy (ohledně instrukcí pro zpracování, atributů a podobně)

V této výstupní metodě má význam používat atribut indent elementu xsl:output, a proto má implicitní hodnotu "yes" a atribut version určuje verzi výstupního HTML a má implicitně hodnotu "4.0".

Tato výstupní metoda také doplní element meta specifikující kódování dokumentu jako první položku do elementu head, samozřejmě pouze pokud element head ve výstupním stromu existuje.

XML

Výstupní metoda "xml" je implicitní a jedná se o prostý výstup XML dokumentu, takový dokument má XML deklaraci (což můžeme vypnout atributem omit-xml-declaration), speciální znaky jsou v něm nahrazeny entitami dle zvyklostí XML a podobně.

Pomocí atributu cdata-section-elements můžeme vyjmenovat elementy, jejichž textový obsah bude vypsán jako sekce CDATA namísto normálního textu s případným nahrazením speciálních znaků entitami.

Stejně jako v případě HTML funguje atribut indent, jímž můžeme povolit odsazovaní, ovšem pro XML má implicitní hodnotu "no".

Text

Tato výstupní metoda se hodí na cokoli, co není XML a není HTML, jedná se o prostý výstup nějakého textu. Obsahem výstupu jsou pouze textové uzly výstupního stromu v pořadí, v jakém za sebou následují v tomto stromu.

Pomocí atributu encoding určíme kódování výstupu. Vzhledem k tomu, že v tomto režimu není možné (a ani vhodné) nahrazovat znaky nevyjádřitelné ve výstupní znakové sadě entitami, způsobí výskyt takového znaku chybu.

Většina ostatních atributů elementu xsl:output postrádá pro tuto metodu smysl, jediný, který může ještě jakýsi smysl mít, je media-type, s jeho pomocí určíme MIME typ výstupu (což využijme nejspíše pouze na serveru při použití nástrojů typu mod_xslt)

Pomocí metody "text" můžeme generovat opravdu ledacos, prostým textem počínaje a zdrojovým kódem v C++ či XBM bitmapou konče. Pokud pomineme určitou dávku nepohodlí, bylo by možné i generovat některé polo-binární formáty, ovšem osobně bych vám tento přístup silně nedoporučoval, není to tak jednoduché, jak se může na první pohled zdát.

Ačkoli můžeme pomocí XSLT vygenerovat ledacos, řekl bych, že většina složitějších konverzí s použitím výstupní metody "text" vyjde mnohem rychleji (jak na čas vývoje tak na čas běhu vlastního programu), pokud je implementujeme jako samostatný program, soubor funkcí či třídu v nějakém obecném programovacím jazyce podporujícím práci s XML na použitelné úrovni.

S výstupem dokumentu také souvisí dva elementy, které jsem v minulém dílu nezmínil. Element xsl:strip-space určuje, ve kterých elementech dojde k odstranění textových uzlů obsahujících pouze prázdné místo (mezery, tabulátory, nové řádky...). Seznam těchto elementů (oddělených mezerami, můžeme též použít hvězdičku jako zástupný znak pro jakýkoli element) uvedeme v atributu nazvaném překvapivě elements. Implicitně se takto neděje v žádných elementech. A druhý element je xsl:preserve-space, má opět atribut elements a slouží k potlačení efektu elementu xsl:strip-space na dané elementy ve výstupním dokumentu.

Ke stejnému účelu můžeme použít ve výstupním dokumentu atribut xml:space s hodnotou preserve, ovšem musíme si být vědomi toho, že se tento atribut bude vyskytovat i ve výstupu.

Ovšem činnost těchto elementů spolu s atributem indent elementu xsl:output začne být poněkud nejasná, procesor totiž odsazování výstupu zajišťuje právě pomocí přidávání a mazání textových uzlů obsahujících mezery, tabulátory a nové řádky. Pokud tedy potřebujete mít kontrolu nad tím, kde prázdné místo bude a kde ne, nepoužívejte odsazování.

Tím máme za sebou větší část XSLT, příště se podíváme na funkce kterými XSLT rozšiřuje jazyk XPath.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=405