Perl (31) - Testování souborů

Hlavní náplní třetího dílu o souborech je zjišťování vlastností souborů pomocí k tomu určených operátorů.

13.4.2006 10:00 | Jiří Václavík | přečteno 29842×

V předcházejících dílech jsme se z oblasti práce se soubory zabývali pouze tím nejzákladnějším. Dnes navážeme a v poněkud praktičtějším díle si představíme poměrně často používané nástroje, které využijeme zejména při ošetřování chyb.

Testování souborů

Zjišťování vlastností souborů se děje skrze operátory pro testování souborů. Vycházejí z interpretu Unixu, proto vypadají podobně jako přepínače. Přijímají argument, jímž je název souboru nebo ovladač. Není-li argument uvedem, automaticky se použije obsah výchozí proměnné.

Typická situace pro použití těchto operátorů nastane, když chceme minimalizovat množství chyb při otevírání souborů. Úkolem pro ně může být například detekce práv. Jindy můžeme chtít zapisovat do souboru, přičemž soubor již existuje. V tom případě se původní obsah souboru smaže, což může mít v určitých případech neblahé následky. Toto lze řešit právě testováním souborů.

Zde je tabulka s výčtem operátorů pro testování:

TestVýznam
-esoubor existuje
-zsoubor existuje a je prázdný
-svrací velikost souboru v bajtech
-dsoubor je adresářem
-lsoubor je symbolickým odkazem
-fsoubor je "obyčejným" souborem (ne tedy adresářem apod.)
-psoubor je pojmenovanou rourou, nebo je rourou ovladač
-Ssoubor je socket
-bsoubor je blokový soubor
-csoubor je znakový soubor
-tsoubor je prostředkem tty (STDIN)
-xsoubor je spustitelný
-wdo souboru lze zapisovat
-rsoubor lze číst
-Bsoubor je binární
-Tsoubor je textový
-Apočet dní od posledního přístupu k souboru
-Mpočet dní od poslední změny souboru
-Cpočet dní od poslední změny i-uzlu
-usoubor má nastavený setuid bit
-gsoubor má nastavený setgid bit
-ksoubor má nastavený sticky bit

Všechny testy přijímají argument v podobě názvu souboru nebo ovladače. Ten může a nemusí být uveden v závorkách.

-r "soubor";
-r("soubor");

Tyto operátory se téměř výhradně používají v podmínkových konstrukcích. Je to dáno mimo jiné tím, že kromě operátorů pro získávání časových údajů a operátoru -s, který vrací délku souboru, je má smysl používat pouze k testování pravda-nepravda.

Abychom si předvedli, jak se operátory používají, uvedeme si tři krátké úseky kódu. První a nejjednodušší bude vyšetřovat soubor a.out z hlediska práv.

$file = "a.out";
print "Soubor $file:\n";
print "Lze číst\n" if -r $file;
print "Lze zapisovat\n" if -w $file;
print "Lze spouštět\n" if -x $file;
print "Nastaven SUID\n" if -u $file;
print "Nastaven SGID\n" if -g $file;
print "Nastaven sticky\n" if -k $file;

Pokud si zkusíte skript spustit pod uživatelem s omezenými právy, změní se samozřejmě i výstup našeho programu.

Dále si demonstrujme ochranu před nechtěným přepsáním souboru.

$zaloha = "zaloha.bck";

if (-e "soubor"){
    print "Soubor $zaloha již existuje! Přepsat? (a/n) ";
    chomp($volba = <STDIN>);
    if (lc $volba ne "a"){
        die "Záloha nebyla provedena.\n";
    }
}

open (ZALOHA, ">$zaloha") or die "Chyba: $!";
...

Soubor je otevřen pro zápis jen v případě, že test byl vyhodnocen jako false nebo pokud program dostal výslovný souhlas soubor přepsat.

Operátor -s získává velikost souboru v bajtech. Napíšeme program, který bude vypisovat velikost zadaného souboru, pokud půjde o obyčejný soubor. Využijeme také toho, že operátory pracují s výchozí proměnnou.

while(<STDIN>){
    chomp;
    next unless -f;
    $velikost = -s;
    print "$_ ${velikost}B\n";
}

Zjišťování informací z i-uzlů

Fuknce stat, podobně jako stejnojmenný systémový příkaz, zpřístupňuje i-uzel. V něm jsou uloženy důležité informace o každém souboru. Parametrem funkce stat je ovladač nebo jméno souboru. Funkce vrací pole hodnot s následujícími informacemi o souboru.

IndexNázevVýznam
0devčíslo zařízení souborového systému
1inočíslo i-uzlu
2modemód souboru (typ a práva) v desítkovém zápisu
3nlinkpočet pevných odkazů na soubor
4uiduid vlastníka
5gidgid vlastníka (tedy id skupiny)
6rdevidentifikátor zařízení (význam má jen u speciálních souborů. U obyčejných vrací 0)
7sizevelikost souboru v bajtech
8atimečas posledního přístupu k souboru
9mtimečas poslední změny souboru
10ctimečas poslední změny i-uzlu
11blksizevelikost bloku
12blockspočet alokovaných bloků

Pokud chceme informace o symbolickém odkazu, použijeme lstat.

S využitím hodnoty mtime a funkce localtime, která čas poslední změny souboru převede do srozumitelného formátu, napíšeme program, který vypisuje datum a čas poslední změny souboru. Fungovat bude prakticky stejně jako náš program na zjišťování velikostí souborů, jen bude vypisovat jinou informaci.

while(<STDIN>){
    chomp;
    next unless -e;
    $mtime = (stat)[9];
    ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime($mtime);
    $datum = sprintf("%02d.%02d.%4d", $mday, $mon, $year+1900);
    $cas = sprintf("%02d:%02d:%02d", $sec, $min, $hour);

    print "Posledni zmena souboru je z $datum, $cas\n";
}

ID ovladače

Příkaz fileno vrací deskriptor ovladače. To je nějaké číslo, které je pro shodné ovladače stejné. Používá se právě k testování shodnosti ovladačů.

open(IN, "<-") or die "Chyba: $!";
open(OUT, ">-") or die "Chyba: $!";

print fileno IN;   #0
print fileno OUT;  #1
print fileno STDIN;#0

if (fileno IN == fileno STDIN){
    print "Ovladač IN směřuje na standartní vstup";
}

Příští díl bude poslední k tématu práce se soubory. Zaměří se na jiné druhy souborů než obyčejné textové a navíc se podíváme na adresářovou rekurzi.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1177