Perl (3) - skaláry I

Tímto dílem začne povídání o skalárních datech. Postupně si vysvětlíme, co skalární data jsou, jaké s nimi můžeme provádět operace, atd. Vše bude zatím mírně v matematicko-teoretické rovině.

26.10.2004 15:00 | Josef "jose" Kadlec | přečteno 10122×

Ještě než se vrhneme na samotné skaláry, přerušíme naše, mírně teoretické povídání a ukážeme si čistě prakticky, jak takový perlivý skript vypadá, abychom si mohli následující příklady rovnou zkoušet. Začneme tradičně a to skriptem, který vypíše něco jako "Hello, world.". Takový skript by mohl vypadat například takto:

#!/usr/bin/perl

print "Hello, world.\n";

Jak prosté. První řádka ukazuje cestu k samotné binárce Perlu (na vašem unixovém systému se cesta může lišit). Pokud používáte Perl pod win32, tak tato řádka není vůbec nutná, nýbrž doporučuje se ji uvádět a to už jen kvůli přenositelnosti mezi různými platformami. Následně se volá funkce print, která vypisuje daný řetězec, který je ukončen escape sekvencí pro přechod na další řádek.

Skript můžete napsat v jakémkoliv textovém editoru - na unixových systémech např. v editoru vim, gvim, pico, joe a dalších textových, či grafických editorech. Na win32 využijete např. důvěrně známý notepad, ale najdete i spoustu dalších editorů, které vám budou navíc zvýrazňovat syntax. Pro spuštění skriptu na unixových systémech je potřeba souboru přidat příznak spustitelnosti, což realizujete následujícím příkazem:

bash-2.05b$ chmod +x skript.pl

a nebo bezpečněji

bash-2.05b$ chmod u+x skript.pl

, což zajistí spustitelnost pouze vlastníkovi souboru. Spuštění se provádí jako každé jiné spustění souboru:

bash-2.05b$ ./skript.pl

za předpokladu, že skript spouštíme z adresáře, který není v cestě (proměnná $PATH).

Ještě doplním, že může být výhodné zapnout varování v Perlu. To se provádí přepínačem -w, takže první řádek, kde určujeme cestu k interpretu Perlu, bude vypadat takto:

#!/usr/bin/perl -w 

Při takto spustěném skriptu budete Perlem upozorňováni na chyby nebo nějaké neobvyklé pasáže v kódu.

Protože téma probíráme pěkně od podlahy, tak se teď rychle vrátíme ke skalárním datům.

Typy skalárů

Skalár může být v Perlu tvořen např. číslem jako 8, 0x345 či 4.432e10. Může být také tvořen znakovým řetězcem jako Pepa či Josef Kadlec.

Ačkoliv čísla můžeme rozdělit na dva typy a to na čísla typu integer (např. 344 nebo 2) a na čísla s pohyblivou desetinou čárkou - reálná desetinná čísla (např. 4.94 nebo 2.32e5), Perl interně používá pouze typy, které lze v C označit typem double. Čísla typu integer můžeme vidět tedy např. v desítkové soustavě (344) nebo v šestnáctkové soustavě (0xff). K převodu mezi těmito soustavami můžeme využít funkce oct a hex.

Řetězec je sekvence osmi bitových znaků z 256ti znakové sady. Nejkratší řetězec má 0 znaků a nejdelší má tolik, na kolik stačí paměť daného počítače. Je potřeba rozlišovat řetězce uvozené v jednoduchých uvozovkách a řetězce uvozené klasickými uvozovkami. Rozdíl je takový, že u prvního typu řetězce je platný každý znak mezi jednoduchými uvozovkami. Pokud oddělíte část řetězce Enterem, bude řetězec obsahovat přechod na další řádek. Více si ukážeme na příkladech:

''             # prázdný řetězec
'pepa'         # řetězec o 4 znacích p, e, p, a
'Josef 
Kadlec'        # řetězec o 12 znacích  
                         - musíme počítat znak nového řádku
'perl\n'       # řetězec o 6 znacích p, e, r, l, \, n
'true\\false'  # řetězec o 10 znacích 
                          - t, r, u, e, \, f, a, l, s, e   
Řetězce uvozené klasickými dvojitými uvozovkami se více podobají řetězcům, jaké známe z jazyka C. Začnu příklady:
"perl\n"       # řetězec obsahuje znaky p, e, r, l 
                        následované přechodem na nový řádek
"true\tfalse"  # řetězec obsahuje t, r, u, e 
                        tabulator f, a, l, s, e
Vidíme, že zde fungují tzv. escape sekvence. V případě řetězců uvozených jednoduchými uvozovkami bychom museli použít zpětná lomítka dvě. Následuje výčet vybraných escape sekvencí.
"\n"    # přechod na novou řádku
"\t"    # tabulátor
"\r"    # enter (return)
"\b"    # backspace
"\a"    # zvonek
"\077"  # zvonek vyjádřený v desítkové soustavě
"\cC"   # Ctrl+C
"\\"    # zpětné lomítko
"\""    # jedna klasická uvozovka

Převody mezi čísly a řetězci nemusíme provádět - hodnoty jsou navzájem zaměnitelné. Tzn. když přičteme číslo 2 k řetězci "343", tak výsledek bude číslo 345. To však není vše. Slučovat lze i zdánlivě neslučitelné řetězce a čísla. Např. pokud sečteme "55pepa" a 5, výsledek bude 60. Perl tedy přebytečné znaky vypustí. Pokud řetězec neobsahuje žádné číslice, bude převeden na nulu.

Skalární data lze ukládat do tzv. skalárních proměnných. Tyto proměnné v Perlu poznáme podle toho, že začínají znakem dolaru ($). Za tímto znakem následuje sekvence alfanumerických znaků. Ovšem není to zcela bez pravidel. Název musí začínat znakem nebo podtržítkem (samozřejmě až za znakem dolaru). Jsou výjimky, které jsou ovšem vyhrazeny pro speciální proměnné Perlu. Za prvním znakem už mohou následovat jakékoliv písmena, čísla či podtržítko. Dále je potřeba brát na zřetel, že se rozlišují velká a malá písmena v proměnných. Tzn. že $variable není to samé jako $VARIABLE nebo $VaRiABLE. Délka názvů proměnných je omezená na 255 znaků. Jenom ještě upozorním, že toto platí pro všechny proměnné - nejen ty skalární.

Proměnné nemusíme nijak deklarovat - jestli jste zvyklí např. z jazyka C. Neinicializované proměnné budou mít prostě hodnotu prázdného řetězce (nebo jako nula). Ovšem pokud máte zaplá varování, budete na tyto proměnné Perlem upozorněni.

Nejpoužívanějším operátorem (symbolem) pro přiřazení hodnoty proměnné je rovnítko (=). Proměnná je před rovnítkem a přiřazovaná hodnota za rovnítkem, takže např.:

$var = 45;

Přiřadili jsme hodnotu 45 do proměnné $var. Lze však tvořit komplexnější přiřazení. Výraz je vyhodnocován zprava doleva, takže např.:

$var = $val = 45;

Příště se podíváme na operátory se skalárními daty.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=360