ARCHIV |
|||||
Software (10844)
Distribuce (131)
Skripty (697)
Menu
Diskuze
Informace
|
Perl (135) - XML - čtení a zápisXML je univerzálním jazykem pro přenos nejrůznějších dokumentů. Jak si s jeho parsováním poradí Perl? Jazyk XML (Extensible Markup Language) netřeba dlouze představovat. Jde o značkovací jazyk, který se masivně používá pro přenos dokumentů. Příklad XML dokumentu je k vidění na Wikipedii. Nyní budeme zkoumat nástroje, které dokáží v našich programech s XML pohodlně zacházet. Díky oblibě XML jich je k dispozici celá řada. Základním nástrojem pro nejjednodušší operace s XML daty je modul XML::Simple z archivu modulů CPAN. XML::Simple umí jedinou věc - konvertuje XML data do datové struktury Perlu a naopak. Hned na úvod poznamenejme, že XML::Simple má jeden zásadní nedostatek. Nelze mixovat obsah a elementy uvnitř jednoho elementu. S tím si XML::Simple neporadí a je třeba použít něco silnějšího. Další potenciální slabinou XML::Simple je, že je náročný na paměť a u extrémně velkých souborů to může působit problémy. S tím souvisí i to, že nelze zpracovávat data dávkově. K tomu slouží specializované moduly, které pracují s nástrojem zvaným SAX. Modul XML::Simple obsahuje dvě hlavní metody. XMLin pro načtení XML souboru a naopak XMLout pro export do XML. Čtení XML datBudeme na chvíli pracovat s následujícím souborem.
Podívejme se na úvod, jak tedy načteme XML soubor katalog.xml.
Zároveň jsme díky modulu Data::Dumper vytiskli strukturu právě vytvořené proměnné $katalog.
Jako parametr XMLin jsme uvedli jméno souboru. Kdybychom použili metodu bez argumentů, hledal by se soubor stejného názvu jako skript (přesněji __FILE__) s tím, že by se přípona pozměnila na .xml. Další možností je vložit přímo řetězec ve formátu XML. Modul funguje i s objektovým přístupem.
Uveďme zde ještě pár poznámek, jak se data ukládají. Především, ukládání do datové struktury je ztrátové, ale není to nic kritického. Na několika příkladech si nyní vysvětlíme, jak konverze probíhá. Podle nich uvidíme, kde dochází k nejednoznačnostem, které se potom pokusíme odstranit. Ne u všech to půjde. Uvnitř elementu může být buď text nebo další struktura elementů. Je-li tam text, pak se též objeví jako příslušná hodnota hashe. V opačném případě bude touto hodnotou nějaká další anonymní datová struktura. Pokud máme XML opakované elementy, pak jsou položky (knihy) reprezentovány jako prvky anonymního pole.
Pokud je rozlišíme parametrem s názvem id (tak jsme to udělali v případě knih i v úvodním příkladu), pak se ukládají jako hash tvaru {1=>{...}, 2=>{...}, ...}.
Dodejme ještě, že úplně stejně by se do datové struktury uložilo následující.
Nabízí se otázka: Jde celé toto "chytré" chování nějak obejít? Odpověď je: Ano, stačí data načítat s parametrem ForceArray => 1. Výsledná datová struktura je složitější a strukturou více popisuje vstupní data.
Opět zde narážíme na nedostatky XML::Simple. Vždy jde o to, co vlastně chceme. Pokud jen chceme získat několik jednotlivých dat a nejednoznačnosti nejsou podstatné, bude se lépe pracovat s původní verzí (avšak zde poznamenejme, že robusnější řešení nabízí xPath). Pokud chceme XML upravit a uložit, bude lepší využít ForceArray, neboť výsledné XML by se pak mohlo hodně změnit (to uvidíme podrobněji dále). Dalších parametrů je celá řada. Pro další informace se odkažme na dokumentaci. Ještě si všimněme, jak se element <citace></citace> objevil ve výsledné datové struktuře. Již jsme na to narazili v úvodu. Pokud se uvnitř elementu objevuje text (což je zde fyzicky obsah elementu <content></content>) a další elementy, pak XML::Simple vůbec neumí rozlišit jejich pořadí. Měli bychom tedy použít nějaký jiný nástroj. Práce s jednotlivými daty a xPathSamozřejmě můžeme pomocí pravidel pro datové struktury tisknout i konkrétní skaláry. Například následující volání má za následek vytisknutí autora 1. knihy v seznamu.
Pravdou však je, že to není příliš pohodlné. Je ale třeba si uvědomit, že pro tisk jakýchkoliv dat je uvedení cesty k nim nezbytné. Přirozenou otázkou je, zda neexistuje nějakým způsobem standardizovaná cesta k jednotlivým datům ve formě řetězce. Ano, samozřejmě již existuje a daný jazyk se nazývá xPath. Nebudeme se jím podrobně zabývat, pouze si uvedeme příklad. Na CPANu je řada modulů, které xPath podporují. Uveďme například XML::XPath::Simple. Autora první knihy zde získáme takto.
Pro zájemce o xPath je k dispozici například tutoriál na w3schools.com . Zápis XML datNyní bychom samozřejmě mohli s touto strukturou pracovat. To zatím ponechme stranou a podívejme se, jak z datové struktury vytvoříme XML. O výstup do XML dat se stará Metoda XMLout. Vytiskněme na úvod naši datovou strukturu $katalog na standardní výstup ve formátu XML.
Výstup nás možná překvapí, protože náš původní XML soubor vypadal trochu jinak. Důvod jsme již uvedli. Struktura dat nicméně zůstává stejná.
Předně, velmi záleží na tom, zda jsme načetli XML soubor s parametrem ForceArray. Předcházející soubor nám vznikl bez ForceArray. Jeho nastavením získáme lehce změněný výstup, který je podobnější úvodní verzi.
Nastavením dodatečných parametrů pro metodu XMLout můžeme docílit ještě dalších změn. Parametrem KeepRoot => 0 se zbavíme obalujícího elementu <opt></opt>. Také se nám cestou ztratila úvodní deklarace z XML souboru. Můžeme ji doplnit parametrem XMLDecl => "<?xml version='1.0'?>". Abychom nemuseli vrácený řetězec složitě zapisovat do souboru, lze užít také parametr OutputFile => 'novy_katalog.xml', který vytiskne výsledek do uvedeného souboru na místo standardního výstupu. Výsledné volání nyní vypadá takto.
Související články
Předchozí Celou kategorii (seriál) Další
Perl (1) - Dávka teorie na úvod
Perl (2) - Úvod do syntaxe Perl (3) - Proměnné Perl (4) - Čísla a řetězce Perl (5) - Podmínky Perl (6) - Pravdivostní výrazy Perl (7) - Vstup poprvé Perl (8) - Některé základní vestavěné funkce Perl (9) - Cykly Perl (10) - Další řídící struktury Perl (11) - Pole - úvod Perl (12) - Pole - základní operace Perl (13) - Hashe Perl (14) - Další nástroje pro seznamy Perl (15) - Výchozí proměnná, heredoc, symbolické odkazy Perl (16) - Regulární výrazy - začínáme Perl (17) - Regulární výrazy - kotvy Perl (18) - Regulární výrazy - množiny znaků Perl (19) - Regulární výrazy - opakování a kvantifikátory Perl (20) - Regulární výrazy - magické závorky Perl (21) - Regulární výrazy - nahrazování Perl (22) - Regulární výrazy - přepínače Perl (23) - Regulární výrazy - rozšířené vzory Perl (24) - Regulární výrazy - příklady Perl (25) - Regulární výrazy - závěr Perl (26) - Podprogramy Perl (27) - Prototypy Perl (28) - Rozsahy platnosti proměnných Perl (29) - Úvod k práci se soubory Perl (30) - Práce se soubory Perl (31) - Testování souborů Perl (32) - Jiné typy souborů Perl (33) - Formátování výstupu - printf Perl (34) - Formátování výstupu - formáty Perl (35) - Vestavěný debugger Perl (36) - Grafické debuggery Perl (37) - Začínáme s moduly Perl (38) - Rozhraní modulu Perl (39) - Pragma Perl (40) - Dodatky k modulům Perl (41) - CPAN Perl (42) - Argumenty příkazového řádku Perl (43) - Přepínače Perl (44) - Dlouhé přepínače Perl (45) - Odkazy Perl (46) - Užití odkazů a anonymní data Perl (47) - Složitější datové struktury Perl (48) - Libovolně složité datové struktury Perl (49) - Tabulky symbolů a typegloby Perl (50) - Uzávěry a iterátory Perl (51) - Signály Perl (52) - Externí příkazy Perl (53) - Režim nakažení Perl (54) - Fork Perl (55) - Eval Perl (56) - Volby příkazu perl Perl (57) - Jednořádkové skripty Perl (58) - OOP - úvod Perl (59) - OOP - typické použití Perl (60) - OOP - dědičnost Perl (61) - OOP - přínos a užití dědičnosti Perl (62) - OOP - přetěžování Perl (63) - OOP - závěr Perl (64) - Projekt - čtečka sportovních výsledků Perl (65) - Projekt - získání dat Perl (66) - Projekt - výběr zápasů a podrobnosti Perl (67) - Projekt - dokončujeme modul Perl (68) - Projekt - zobrazení zápasů Perl (69) - Projekt - online přenos Perl (70) - Plain Old Documentation Perl (71) - Navazování proměnných Perl (72) - Navazování složitějších datových typů Perl (73) - DBM Perl (74) - Sockety Perl (75) - Obsluha více klientů Perl (76) - Síťová hra v kostky Perl (77) - Služby internetu Perl (78) - Databáze - úvod Perl (79) - Databáze - manipulace s daty Perl (80) - Databáze - závěrečné poznámky Perl (81) - CGI - příprava webového serveru Perl (82) - CGI - první skripty Perl (83) - CGI - získávání dat od uživatele Perl (84) - CGI - usnadnění tvorby skriptů pomocí modulu CGI Perl (85) - CGI - generování dokumentu modulem CGI Perl (86) - CGI - cookies Perl (87) - CGI - příklad aplikace Perl (88) - CGI - závěr Perl (89) - Mason - snadné psaní webů Perl (90) - Mason - speciální bloky Perl (91) - Mason - handlery Perl (92) - Mason - závěr Perl (93) - Catalyst - MVC framework pro Perl Perl (94) - Catalyst - základy pro psaní aplikace Perl (95) - Catalyst - šablony Perl (96) - Catalyst - spolupráce s databází Perl (97) - Curses - tvorba textových uživatelských rozhraní Perl (98) - Curses - pozicování a okna Perl (99) - Curses - měření rychlosti psaní Perl (100) - Curses - použití hotových widgetů Perl (101) - Curses - jednoduchý textový editor Perl (102) - Rozšiřování Perlu pomocí XS Perl (103) - Rozšiřování Perlu pomocí SWIG Perl (104) - Testování rychlosti Perl (105) - Testování programových jednotek Perl (106) - Debugování pomocí komentářů Perl (107) - Moose - moderní objektový systém Perl (108) - Moose - základní vlastnosti Perl (109) - Moose - role Perl (110) - Moose - meta API Perl (111) - Pokročilá práce se seznamy Perl (112) - Práce s PDF Perl (113) - Práce s archivy Perl (114) - Tk - úvod Perl (115) - Tk - umísťování widgetů Perl (116) - Tk - základní widgety Perl (117) - Tk - některé pokročilejší widgety Perl (118) - Tk - čas a události Perl (119) - Tk - CD man Perl (120) - Wx - základní práce s widgety Perl (121) - Wx - události Perl (122) - Gtk2 - úvod Perl (123) - Gtk2 - základní práce s obrázky Perl (124) - Gtk2 - události a čas Perl (125) - Gtk2 - vlastní widgety Perl (126) - Gtk2 - textové okno a práce s pozicemi Perl (127) - Gtk2 - hierarchické seznamy Perl (128) - Gtk2 - dialogy Perl (129) - Gtk2 - skládání widgetů Perl (130) - Gtk2 - menu a toolbary Perl (131) - Gtk2 - transparentní okna, tray ikona, výběr souborů Perl (132) - Gtk2 - drag&drop, druid Perl (133) - Gtk2 - úpravy vzhledu aplikací pomocí rc Perl (134) - Gtk2 - Glade Interface Designer Perl (136) - XML - DOM a SAX přístupy Perl (137) - Vlákna Perl (138) - Memoizace - cachování podprogramů Perl (139) - Profilling - efektivní odhalování pomalých míst v programu Perl (140) - Profilling - píšeme si vlastní profiler / debugger Perl (141) - Formátování kódu, deparsování, perltidy Perl (142) - Způsoby konfigurování Perl (143) - Struktura datových typů, správa paměti Perl (144) - POE - událostmi řízené programování Perl (145) - POE - aplikace typu klient-server Perl (146) - Perl 6 - jazyk budoucnosti Perl (147) - Perl 6 - regulární výrazy, nové operátory Perl (148) - Perl Culture Perl (149) - Závěr Pozvánka na Český Perl Workshop Perl 5.22.0 a vše okolo Perl 5.24.0 a vše okolo Předchozí Celou kategorii (seriál) Další
|
Vyhledávání software
Vyhledávání článků
28.11.2018 23:56 /František Kučera 12.11.2018 21:28 /Redakce Linuxsoft.cz 6.11.2018 2:04 /František Kučera 4.10.2018 21:30 /Ondřej Čečák 18.9.2018 23:30 /František Kučera 9.9.2018 14:15 /Redakce Linuxsoft.cz 12.8.2018 16:58 /František Kučera 16.7.2018 1:05 /František Kučera
Poslední diskuze
31.7.2023 14:13 /
Linda Graham 30.11.2022 9:32 /
Kyle McDermott 13.12.2018 10:57 /
Jan Mareš 2.12.2018 23:56 /
František Kučera 5.10.2018 17:12 /
Jakub Kuljovsky | |||
ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2024) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze |