Perl (52) - Externí příkazy

Tentokrát o spouštění shellových příkazů uvnitř programu.

12.2.2007 06:00 | Jiří Václavík | přečteno 25502×

Při psaní programů nastanou situace, kdy potřebujeme implementovat něco, co již napsané je, ale je to externí program. Pokud nevadí, že u takového programu nemůžeme ovlivňovat jeho činnost - tj, že ho můžeme pouze spustit a případně vzít výstupy -, pak ho lze snadno použít. Perl totiž má hned několik nástrojů pro spouštění shellových příkazů.

Než se do nich ale pustíme, měli bychom nejprve upozornit na několik rizik.

Spuštění externího programu je potenciální bezpečnostní díra. Je na místě dbát zvýšené pozornosti a všechny příkazy, které jsou shellu posílány, pečlivě kontrolovat. Perl z tohoto důvodu nabízí tzv. mechanizmus nakažení, který žádným potenciálně nebezpečným datům nedůvěřuje. Budeme se jím zabývat v následujícím díle.

To však není jediný důvod proč je lepší se spouštění shellových příkazů vyhnout. Bude také trpět přenositelnost. A nezřídka bude mít takový program vyšší nároky.

Funkce system

Vestavěná funkce system provede externí program tak, že nejprve spustí kopii aktuálního procesu (pomocí fork) a přepíše ji voláním tohoto externího programu. Dále program čeká, až se externí program ukončí.

system očekává jako parametr řetězec. Tento řetězec předá shellu, aby jej provedl jako příkaz.

system "ls";

Skript i volaný externí příkaz přitom sdílejí stejný standartní vstup a standartní výstup, dále pak i chybový výstup nebo informace prostředí.

Z tohoto důvodu nelze dostat výstup příkazu, protože ten je pouze normálně vytisknut. Jediným řešením, jak to změnit, je použití nějaké funkce shellu - tedy přesměrování. Pomocí něj je možné výstup ukládat do souborů.

system "ls > vystup";

Nebo, pokud žádný výstup nechceme, přesměrujeme do černé díry.

system "ls > /dev/null";

Umístěním funkce system na pravou stranu přiřazení tedy žádný výstup nezískáme. Získáme pouze návratovou hodnotu volaného příkazu. I to se však může hodit - například při testování, zda dopadl externí příkaz bez chyb.

$navratova_hodnota = system "ls";

Shellové příkazy obvykle vracejí v případě úspěchu 0 a v případě opačném jiné číslo. To mimo jiné znamená, že nemůžeme použít konstrukci příkaz or die;. Ale pokud na ni trváme, lze ji následovně modifikovat.

system "ls" and die "chyba\n";

Pomocí jednoho volání funkce system lze zavolat více příkazů. Přesněji řečeno, je to možné, pokud je v shellu definován znak pro oddělování příkazů. Oddělovači příkazů jsou obvykle středník nebo znak nového řádku.

system "echo 'soubory v aktuálním adresáři: '; ls";
system "echo 'soubory v aktuálním adresáři: '\n ls";

Pokud je funkci system předán seznam řetězců, jsou druhý a další řetězce brány jako argument pro příkaz, jehož název skrývá první řetězec. Argumenty ale, ostatně jsme to již viděli, lze předávat i ve stejném řetězci jako samotný příkaz.

Vytvoříme pro ukázku primitivní nadstavbu shellu, která nic neumí a bude pouze přijímat příkazy a vykonávat je.

while (<>) {
    chomp;
    last if $_ =~ /\d*exit\d*/;
    system $_;
}

Funkce exec

Funkce system ve skutečnosti spustila kopii aktuálního procesu a ta byla přepsána příkazem, který byl externě volán. Tento přepis procesu zajišťovala právě funkce exec.

Pokud použijeme místo system funkci exec, přepíšeme tím stávající proces - externí příkaz se vykoná, ale řízení procesu již nebude vráceno našemu programu (přesněji řečeno - nebude vráceno, pokud je program spuštěn úspěšně). Po vyřízení volaného příkazu celý proces končí.

Zde je ukázka. Text "po exec\n" již nebude vytisknut.

print "před voláním exec\n";
exec "echo 'v exec'";
print "po exec\n";

Vytisknut by byl v případě, že by volaný příkaz skončil neúspěšně.

print "před voláním exec\n";
exec "neexistujici_prikaz";
print "po exec\n";

Obrácené apostrofy

Další možností, jak provést shellový příkaz, je umístit ho do obrácených apostrofů (na americké klávesnici je obrácený apostrof nad tabulátorem). Navíc je tímto způsobem možné získat výstup, jež je návratovou hodnotou.

$vystup_prikazu = `ls`;

Podobně jako uvození apostrofy resp. uvozovkami má i uvození obrácenými apostrofy alternativní syntakční variantu. Lze použít qx//.

$vystup_prikazu = qx/ls/;

Nyní je celý výstup v proměnné $vystup_prikazu. V seznamovém kontextu se výstup rozdělí na řádky (řádek je definován v proměnné $/).

@vystup_prikazu = `ls`;

Návratová hodnota provedeného příkazu je uložena ve speciální proměnné $?.

Uvedeme si krátký skript zjisti_jmeno, který na základě uživatelského jména zadaného jako argument na příkazovém řádku vytiskne skutečné jméno. Údaje budeme čerpat z /etc/passwd. Obrácené apostrofy použijeme k získání řádku s daným uživatelským jménem z tohoto souboru. Z tohoto řádku pak získáme skutečné jméno (nachází se mezi 4. a 5. dvojtečkou) pomocí regulárních výrazů.

#!/usr/bin/env perl
use strict;

die "Pouziti: zjisti_jmeno nick\n" if @ARGV != 1;
my $user = $ARGV[0];
foreach (`less /etc/passwd | grep $user`) {
    /^[^:]+?:[^:]+?:[^:]+?:[^:]+?:([^:]+?):/;
    print "$user je $1\n";
    exit;
}

print "$user nenalezen!\n";

Program vyžaduje z příkazového řádku právě jeden argument. Pokud obdrží jiný počet, vypíše použití.

Spouštění příkazů pomocí open

O další možnosti spouštění shellových příkazů jsme se již letmo zmiňovali v souvislosti s funkcí open.

Jméno otevíraného souboru je lze nahradit příkazem shellu, který musí začínat nebo končit znakem |. Končí-li tímto znakem, výstup příkazu lze číst ze zdroje dat. A naopak začíná-li jím, pak vše, co přes ovladač pošleme, posíláme na vstup zadanému příkazu. Obě roury uvést nelze - v takovém případě bude ta koncová ignorována.

Tento program získá výstup příkazu ls -l, odstraní 1. řádek o počtu souborů a místo něj řádky očísluje.

open LL, "ls -l |" or die "Chyba\n";
<LL>;odstraníme 1. řádek
while (<LL>){
    ++$i;
    printf "%3d: %s", $i, $_;
}

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1416