Dnes se podíváme, jak šikovně ošetříme chyby a jak v Ruby pracovat s regulárními výrazy.
9.4.2012 00:00 | Jakub Lares | přečteno 6206×
Musíme si uvědomit, že v každém programu může docházet k celé řádě chyb. Nebudeme brát v úvahu omyl programátora, ale chyby, které se vyskytnou normálním během programu. Například uživatel zadá špatné jméno souboru, bude chtít dělit nulou atd.
Ošetřování chyb pomocí if/than/else se říká aktivní ošetřování chyb. Ukážeme si to na příkladu s dělením nulou.
puts "zadejte 1. cislo" a = gets.to_i puts "zadejte 2. cislo" b = gets.to_i #Z cyklu vyskocime teprve az uzivatel zada jine cislo nez 0 while b == 0 puts "Chyba, nulou nelze delit! Opakujte prosim zadnai." b = gets.to_i end vysledek = a/b #Operator % zbytek po deleni zbytek = a%b puts "Vysledek: #{a} / #{b} = #{vysledek}" #Zbytek vypiseme pouze pokud nejaky je puts "Zbytek po deleni: #{zbytek}" if zbytek != 0
zadejte 1. cislo 6 zadejte 2. cislo 0 Chyba, nulou nelze delit! Opakujte prosim zadnai. 12 Vysledek: 6 / 12 = 0 Zbytek po deleni: 6
Bude se nám ale stávat, že nebudeme sami vědět, jakým způsobem máme na chybu reagovat. Pro vytvoření opravdu robustního programu musíme tedy testovat výsledky všech volání metod, abychom si byli jistí, že pokrýváme všechny chybové i nechybové stavy. Znamená to nutnost psaní velkého množství podmíněného kódu a kódu, který se stará právě jen o propagaci chyb. Také kdykoli změníme některou existující metodu tak, že může generovat nové, dříve neočekávané chyby, musíme modifikovat veškerá volání takové metody, protože jinak by taková chyba mohla být ignorována. Zkusme se zamyslet, jak bychom detekci a ošetřování chyb mohli vylepšit, aby se pro nás stalo jednodušším a umožnilo nám vytvářet elegantnější a přehlednější kód. Od ideálního řešení očekáváme především, že nám umožní volajícímu objektu signalizovat, že při zpracování jeho požadavku došlo k chybě, a to bez nutnosti dlouhého zkoumání výstupních hodnot. Dále by nám mělo poskytnout přesnou informaci o tom, k jaké chybě došlo, popřípadě také kde. Takovou informaci potřebujeme nejlépe také v textové podobě (nejen jako nějaký číselný kód), abychom případně mohli předat hlášení uživateli, ať již vypsáním na konzoli nebo záznamem v logovacím souboru. Další požadavky máme i na propagaci chyb – v situacích, kdy chybový stav nechceme nebo nemůžeme řešit, měl by automaticky být signalizován volajícímu objektu a ten se pak může opět podobně rozhodovat, jestli bude chybu sám řešit či případně opět propagovat výše v hierarchii volání. V případě propagace chyby volajícímu bychom ale často také chtěli připojit k chybě další vysvětlující nebo popisné informace – uživateli pravděpodobně nebude příliš užitečná chybová hláška "nenalezen soubor C:\config.txt" z obslužného programu pro práci se soubory, pokud nebude vědět, k čemu náš program takový soubor vlastně potřeboval. Pokud se nám tedy podaří při propagaci výjimky přidat např. hlášení "Nezdařilo se načtení nastavení účetního modulu", bude již chyba pro uživatele výrazně přijatelnější. Propagace chyb by zřejmě měla být také selektivní, tj. měli bychom si být schopni vybrat, které chyby řešit na místě a které propagovat výše.
Nejpoužívanějším postupem pro práci s chybovými stavy jsou tzv. výjimky (reprezentují chybové nebo také obecněji výjimečné stavy). Splňují také většinu požadavků, které jsme na dobré řešení chybových stavů kladli. Výjimka sama o sobě je speciální objekt, obsahující informace o chybě, která v programu nastala (tedy např. textovou chybovou hlášku a číselný kód). Aby výjimky byly užitečné, obsahují programovací jazyky speciální operace pro práci s nimi: Operaci raise pro vyvolání výjimky na místě, kde nastala chyba (parametrem této operace je objekt výjimky), Speciální chráněnou sekci/blok, která obsahuje kód, v němž chceme výjimky detekovat (tj. volání metod, které mohou výjimku vyvolat) a konečně S ní nedílně svázanou sekci rescue, ve které provádíme "zachycení výjimky" a řešení chybového stavu, pokud tento v příslušné chráněné sekci nastane. Tomuto způsobu ošetřování chybových stavů říkáme pasivní ošetření chyb. Ukážeme si to opět na příkladu dělení nulou.
Předchozí příklad je možné lehce upravit tak, aby na něm bylo možné demonstrovat použití výjimek. Operace dělení může způsobit výjimku ZeroDivisionError. Tuto výjimku zachytáváme na řádku 10 a pomocí příkazu retry se vracíme na začátek bloku begin a necháme uživatele číslo znovu zadat.
puts "zadejte 1. cislo" a = gets.to_i puts "zadejte 2. cislo" begin b = gets.to_i #Tato operace muze zpusobit chybu a tim vyhodi vyjimku vysledek = a/b zbytek = a%b #Zachytime pripadnou vyjimku rescue puts "Chyba, nulou nelze delit! Opakujte prosim zadani:" #Navrat na zacatek bloku begin retry end puts "Vysledek: #{a} / #{b} = #{vysledek}" #Zbytek vypiseme pouze pokud nejaky je puts "Zbytek po deleni: #{zbytek}" if zbytek != 0
zadejte 1. cislo 6 zadejte 2. cislo 0 Chyba, nulou nelze delit! Opakujte prosim zadani: 6 Vysledek: 6 / 6 = 1
Regulární výrazy jsou vyhledávácí vzory popsané speciální syntaxí, pomocí kterých můžeme provádět složitější operace s textem. Například hledat v textu výskyt podřetězce, vytáhnout z textu část, která odpovídá nějakému vzoru, a nebo tuto odpovídající část něčím nahradit. Základní myšlenku si můžeme ukázat na této úvaze: co kdybychom chtěli najít část textu, která začíná slovem „muž“ a končí spolu s koncem věty, která toto slovo obsahovala? Pokud analyzujeme vyhledávací podmínku, jsme ji schopni trochu formálněji popsat: hledáme všechny podřetězce, kde na první pozici je znak „M“ nebo „m“ (může jít i o slovo na začátku věty, tedy s prvním písmenem velkým) na pozici 2 a 3 jsou postupně znaky „u“ a „ž“ od 4. pozice následují libovolné znaky (nebo také žádné znaky pokud je slovo „muž“ již na konci věty) celý podřetězec končí jedním ze znaků „.“, „?“ nebo „!“. Takový popis je sice poměrně přesný, pro jeho zápis ale budeme používat specializovaný jazyk regulárních výrazů, který při zachování stejné přesnosti umožňuje podstatně kratší zápisy. Zatím prozraďme, že výše uvedenému vyhledávání odpovídá regulární výraz „[Mm]už.*[.!?]“. Regulární výrazy se skládají ze zástupných znaků a kvantifikátorů. Nejjednoduší zástupné znaky jsou písmena - odpovídají sama sobě. Dále existují speciální zástupné znaky, která slouží pro vyhledání určité skupiny písmen nebo znaků. Nejdůležitější zástupné znaky shrnuje následující tabulka:
Zápis | Význam |
---|---|
[ ] | Definuje rozsah. např. vzoru [a-z] vyhovuje jakékoli písmeno malé (anglické) abecedy |
\w | Písmeno, číslo, nebo podtržítko. Ekvivalentní vzoru [a-zA-Z0-9_] |
\W | Cokoliv jiného, než \w |
\s | Bílý znak (mezera, tabulátor, nový řádek). Ekvivalent vzoru [ \t\n\r\f] |
\S | Cokoliv jiného než bílý znak |
\d | Ćíslo, ekvivalentní vzoru [0-9] |
\D | Cokoliv jiného než číslo |
. | Jakýkoliv jeden znak |
Pomocí kvantifikátorů se určuje, kolikrát se daný zástupný znak bude v textu vyskytovat. Kvantifikátory se vždy píšou za zástupné znaky, bez nich nemají smysl.
Zápis | Význam |
---|---|
* | Žádné nebo libovolný počet opakování předchozího |
+ | Jeden nebo více opakování předchozího |
{m,n} | Nejméně m, nejvíce n opakování předchozího |
? | Nejvíce jedno opakování předchozího |
Dále je možné použít následující speciální operátory pro vytváření skupin ve vzoru a rozhodování podmínkou OR.
Zápis | Význam |
---|---|
| | buď vyhovuje předchozí, nebo následující |
() | na vzor uvnitř závorek lze použít kvantifikátor jako na celek |
V jazyce Ruby se regulární výrazy zapisují mezi 2 lomítka //. Takto definovaný regulární výraz je plnohodnotný objekt, lze jej uložit do proměnné a nebo se může rovnou použít pro porovnání s řetězcem. Toto porovnání se provádí pomocí operátoru =~. Pokud řetězec odpovídá vzoru, tak má výsledek tohoto operátoru pravdivou hodnotu, a podmínka if platí.
ruby = "V jazyce Ruby pisu vetsinu svych programu" puts "Test: obsahuje retezec dany podretezec:" #Pomoci operatrou =~ porovname #jestli retezec ruby odpovida regularnimu vyrazu /Ruby/ puts "Ano!" if ruby =~ /Ruby/
Test: obsahuje retezec dany podretezec: Ano!