Představíme si další datovou strukturu - pole.
21.7.2005 06:00 | Jiří Václavík | přečteno 52413×
Známe zatím dva druhy skalárních dat. Řetězce a čísla. Skalár (proměnná se označuje dolarem ($) před názvem) obsahuje jen jednu věc - tedy jeden řetězec , jedno číslo nebo jeden odkaz na něco. Dosud jsme nepracovali s jinými než skalárními proměnnými.
Seznamy oproti tomu obsahují více položek. V Perlu se zapisují oddělené čárkami v kulatých závorkách. Proměnnou, která uchovává seznam, je pole nebo hash. Pole se značí zavináčem (@) před názvem.
Před samotnými poli se podívejme ještě na tzv. kontext. Perl má velmi benevolentní typovou kontrolu a může docházet k takovým věcem, jako je uvedení pole místo skaláru a naopak. Perl má nějaká pravidla, podle kterých takto uvedené pole, resp. skalár, vyhodnocuje.
Co to tedy kontext je? Je to v podstatě totéž jako v běžné řeči. Vezměme si slovo síť. Když zmíníme síť samostatně, nikdo nemůže vědět, kterou síť myslíme. Použijeme-li ji například v souvislosti elektřinou, pravděpodobně půjde o elektrickou síť. Podobně můžeme sítí myslet pavoučí síť, počítačovou síť nebo nějakou další. Záleží na tom, v jakém kontextu síť užijeme. Podobně funguje kontext i v programování.
Uveďme ještě jeden a možná lépe vypovídající příklad. V matematice standardně nemůžeme násobit podtržítka s tečkami nebo umocňovat tučňáka na kružnici. Je zvykem, že operace násobení a umocňování potřebují dostat oba operandy jako číslo. Pro ostatní případy je třeba výsledek operací definovát (nejlépe nějak rozumně).
Funkce se chovají k datům podle toho, v jakém jim je předáváme kontextu - zda jde o seznam nebo skalár (podobnou otázkou je, jestli jde o číslo nebo řetězec, případně logický výraz). Stejná funkce může fungovat s oběma možnostmi. Pak se ale obvykle liší ve zpracování a výsledku. Předáme-li nějaké funkci skalár, může třeba vrátit jeho druhou mocninu. Pokud stejná funkce dostane jako parametr seznam, může vracet pole druhých mocnin původního seznamu, druhou mocninu prvního prvku původního seznamu, nebo klidně něco jiného. Právě proto je vždy dobré vědet, co děláme.
Již víme, že pole je proměnná pro uchovávání nějakého množství skalárů (čísel, řetězců, odkazů).
Jde tedy opět o oblast v paměti, do které ale, narozdíl od skalárních proměnných, můžeme uložit celou řadu hodnot. Pole je seznamem skalárních hodnot.
Skalárním proměnným v poli se říká prvky. Prvek je určen indexem a obsahuje hodnotu. Index je číslo. prvním indexem je nula, dalším 1 atd. Skalární proměnné se značí dolarem, ale pole zavináčem. Přesto se dolar používá pro označení jednotlivých prvků pole. Je to svým způsobem logické - prvek pole uchovává sám o sobě jen skalární hodnotu - například číslo - nikoliv seznam hodnot. Zavináč se používá i v případě řezu polem. Řez polem je totiž opět seznamem.
Poznámka - Podotkněme však, že v Perlu 6 budeme i samotné prvky pole označovat zavináčem.
Práce s poli je v Perlu narozdíl striktních jazyků jako Céčko velmi jednoduchá. Žádná deklarace ani alokace. Platí to, co u proměnných - prostě můžeme pole kdykoliv začít používat.
Vyvstává otázka: Máme přeci proměnné, tak proč používat pole? Oproti proměnným mají pole v jistých situacích řadu výhod. Hodí se na jiné typy úkolů a některé by bez nich byly nerealizovatelné. Představme si, že máme databázi nějakých údajů, například jmen, s kterými nahodile manipulujeme. Použijeme-li pole, nemusíme vymýšlet jména tolika proměnných, kolik lidí máme. Navíc ani nemusíme vědět, kolik jich vlastně je. Také můžeme získat počet jmen jediným příkazem nebo jednoduchým cyklem či užitím map smazat ty, jejichž příjmení začíná na S. Kdykoliv můžeme velmi jednoduše přidat další jméno. Zkrátka pole jsou skvělým pomocníkem a ani jednoduché aplikace se bez nich neobejdou.
Pole vytvoříme, stejně jako skalární proměnnou - přiřazením. Levým operandem je identifikátor, začínající zavináčem a na pravo se uvádí v kulaté závorce hodnoty jednotlivých prvků, oddělené čárkami (tedy vlastně seznam):
@pole = ("hodnota1", "další", "a poslední");
Tím jsme vytvořili tříprvkové pole. Zde je tabulka určující jeho strukturu:
Index | Hodnota |
0 | "hodnota1" |
1 | "další" |
2 | "a poslední" |
Zajímavá pro nás bude také funkce qw. Přesněji řečeno, nejde o funkci, ale o způsob uvození (proto ji označujeme - stejně jako uvozovky - tučně zeleně). Umožňuje položky v uvozovkách, oddělené čárkou, oddělovat jen mezerou (obecně bílým místem). Řetězec není v uvozovkách ani apostrofech. Užijeme ji nejen při delších výčtech.
Tyto příkazy mají stejný význam:
@pole = ("a", "b", "c");
@pole = qw(a b c);
Pole máme, jak z něj číst? Chceme-li získat hodnotu prvku @pole s indexem x, zápis je následující:
$pole[x]
Pozor na to, že prvek pole je skalárem (nikoliv seznamem) a označuje se v Perlu 5, jako jsme tomu byli u skalárů zvyklí, dolarem.
Takže, chceme-li získat data z našeho @pole, použijme následující:
print "Prvek 0: $pole[0]\n";
print "Prvek 1: $pole[1]\n";
print "Prvek 2: $pole[2]\n";
Výstup:
$ perl pole.pl
Prvek 0: hodnota1
Prvek 1: dalsi
Prvek 2: a posledni
$
Pole můžeme editovat i přiřazením do $pole[index]:
$pole[0] = "Perl";
$pole[4] = "Linux";
Za předchozí kód přidejme ještě tento:
print "Prvek 0: $pole[0]\n";
print "Prvek 1: $pole[1]\n";
print "Prvek 2: $pole[2]\n";
print "Prvek 3: $pole[3]\n";
print "Prvek 4: $pole[4]\n";
Po spuštění dostanete:
$ perl pole.pl
Prvek 0: Perl
Prvek 1: dalsi
Prvek 2: a posledni
Prvek 3:
Prvek 4: Linux
$
Výstup ukazuje hned několik skutečností. Přiřazením hodnoty do prvku pole přemažeme původní obsah (index 0). Lze přiřadit hodnotu i do prvku, který bezprostředně nenavazuje na předchozí (index 4). Prvek 3 existuje, ale zůstal nedefinovaný. To i přesto, že prvek 4 definován je.
Následující dva zápisy si jsou ekvivalentní:
@pole = ("a", "b", "c");
$pole[0] = "a";
$pole[1] = "b";
$pole[2] = "c";
Zkopírujme obsah jednoho prvku pole do jiného. Je to stejné, jako u obyčejných proměnných.
@pole = qw(a b c);
$pole[3] = $pole[0]; #do prvku s indexem 3 bude přiřazena hodnota, která je v prvku s indexem 0
Kopírovat můžeme i celá pole.
@pole = qw(a b c);
@pole2 = @pole; #@pole2 je kopií @pole
Jak @pole, tak @pole2 mají stejný obsah.
Stejně tak můžeme kopírovat část pole:
@pole = qw(a b c d e);
@pole2 = ($pole[2], $pole[3], $pole[0]);#@pole2 nyní obsahuje prvky 0, 1, 2
s obsahem po řadě c, d, a.
Chceme-li přiřadit prvek z @pole s indexem 7 do @pole2 (index 4) a zároveň prvek @pole s indexem 3 do @pole2 (index 11), lze použít zápis:
@pole2[7, 3] = @pole[4, 11];
Ekvivalentním zápisem je:
$pole2[7] = @pole[4];
$pole2[3] = @pole[11];
Pokud bude málo prvků v hranatých závorkách (ale platí to obecně, pokud přiřazujeme seznam) na pravé straně přiřazení, doplní se nedefinovanými hodnotami. Přebývají-li, jsou ignorovány prvky navíc zprava.
Podobný příklad jako předchozí:
@pole2 = @pole[4, 11, 25, 94]; #@pole2 nyní obsahuje prvky 0, 1, 2, 3 s obsahem stejným
jako prvky s hodnotami 4, 11, 25, 94 v @poli.
Pole můžeme složit i z několika jiných polí.
@jazyky = qw(Perl Python);
@cisla = (68, 3.14);
@mix = (@jazyky, @cisla); # obsahuje prvky s hodnotami Perl, Python, 68, 3.14
Přidat na konec pole nějakou hodnotu se dá i následovně (později poznáme lepší způsob - funkci):
@jazyky = qw(Perl Python);
@jazyky = (@jazyky, "Ruby");
Perl umožňuje mnoho zvláštních (přesto však nepostrádajích logiku) konstrukcí. Pro zajímavost příklad:
$p = ("a", "b", "c")[1];
print $p;
("a", "b", "c") je vlastně seznamem (polem). Z něj se do $p přiřadí prvek s indexem 1.
Stejně jako je seznamem ("a", "b", "c"), může jím být i ($p1, $p2, $p3). Seznamem je dokonce i ($p). Takto zapsané hodnoty v kulatých závorkách jsou seznamem vždy. Poslední případ je sice jednoprvkovým seznamem, ale stále seznamem. Pokud do pole přiřadíme prázdné závorky, pole bude dokonce prázdné.
V další ukázce přiřazujeme jeden seznam do jiného. Na levé straně samozřejmě musí být proměnné.
($a, $b) = ("a", "b");
print $a; #a
print $b; #b
Existuje řada variací tohoto příkladu. Pokračujme v kódu.
($a, $b) = ($b, $a); #prohození hodnot v proměnných
print $a; #b
print $b; #a
@mix = ($a, 1, 2, $b, "Perl"); #b, 1, 2, a, Perl
@mix2 = ($a, @mix, 4, "Linux") #b, b, 1, 2, a, Perl, 4, Linux
Zatím víme, že index označuje pořadí prvku. Mohou být i záporné. V tom případě je hodnota pořadím od konce pole. Pozor na to, že první prvek od konce se značí $pole[-1], nikoliv $pole[-0]. To proto, že $pole[-0] je stejné jako $pole[0].