Free Pascal (3) - Sockety

Dnešní díl věnujeme, jak jsem slíbil, síťové komunikaci. Ta tradičně v unixových systémech probíhá prostřednictvím tzv. socketů. Budeme se držet dělení knihovny Free Pascalu a dnes začneme s komunikací obecnými sockety, konkretně v rámci jednoho unixového počítače.

28.4.2004 08:00 | Aleš Hakl | přečteno 14203×

Socket (v některé česky psané literatuře též označován "schránka") je abstraktní reprezentace nějakého komunikačního kanálu. Tento mechanismus byl navržen na počátku 80. let v Berkeley během implementace TCP/IP do BSD. I přesto, že jsou sockety odjakživa spojeny s protokolem TCP/IP a internetem, jedná se o velmi obecnou vrstvu, kterou lze beze změn rozhraní použít pro komunikaci v rámci jednoho stroje (tzv. Unix domain sockets, které budeme později v článku používat), přes internet protokoly IPv4 nebo IPv6, v síťích AppleTalk nebo DECnet nebo například takzvaným Packet Radiem protokolem X.25 nebo jeho radioamatérskou variantou AX.25. Pravdou je, že se nejedná o zrovna elegantní řešení a v unixovém systému sockety působí spíše jako pěst na oko. Mnohem elegantněji síťovou komunikaci řeší "pokračování" unixu, operační systém Plan9. Zanechme ovšem teoretizování a vrhněme se na vlastní pascal:

Práci se sockety zajišťuje standardní(pro Free Pascal) jednotka sockets, ta obsahuje wrappery prakticky všech funkcí známých jako tzv. BSD Sockets. Programátory pro majoritní operační systém jistě potěší, že se jednotka chová jako BSD varianta i pokud používá WinSock (tj. nemusíte volat nějaké ty dvě šílené funkce ^_^). Dále v této knihovně nalezneme přetížené funkce, které mnohé standardní volání přibližují pascalské představě.

Dnes se podíváme na jeden z nejjednodušších případů použití socketů, na proudovou komunikaci v rámci jednoho (unixového) stroje, tzv. Unix Domain Sockets. Zde se jako adresy používají názvy souborů, přičemž tyto soubory existují na disku:

srwxr-xr-x   1 dfox  dfox      0 2004-04-26 10:53 ukazkovySocket
Dnešní příklad se bude skládat ze serveru a klienta. Server vytvoří socket /tmp/ukazkovySocket a bude čekat na spojení od klienta. A klient se k tomuto socketu připojí a bude serveru posílat řádky textu od uživatele, které server otočí a pošle zpět (chtěl jsem aby server dělal alespoň něco a nic vhodnějšího mě nenapadlo ^_~).

Začneme s rozborem serverové části. Nejprve vytvoříme socket:

s:=socket(AF_UNIX,SOCK_STREAM,PF_UNIX);
if s=-1 then begin
  halt(1);
end;

Funkce socket(2), která vytvoří nový socket, přijímá jako parametry doménu socketu (AF_UNIX, nebo například AF_INET pro IPv4), jeho typ (SOCK_STREAM pro obousměrné proudové spojení - jako protkol TCP, nebo například SOCK_DGRAM pro datagramové spojení - v případě IP se jedná o protokol UDP). Poslední parametr udává protokol, nejčastěji je shodný s doménou a většinou můžeme místo něj uvést hodnotu 0. Funkce vrátí buďto deskriptor socketu, nebo -1 v případě chyby.

Dále svážeme náš socket s nějakou cestou v souborovém systému:

unlink(fileName);
if not bind(s,fileName) then halt(1);

Nejprve smažeme případný původní objekt s danou cestou voláním unlink(2) z jednotky linux. Poté se pokusíme svázat náš socket s touto cestou pomocí bind(2), pokud toto volání selže, funkce vrátí hodnotu false a náš program končí. Tento způsob volání funkce bind(2) jistě přijde programátorům v jazyce C poněkud zvláštní, jedná se totiž o funkci v jednotce sockets, která obaluje volání listen(2) aby bylo možno pro doménu AF_UNIX používat jako adresu rovnou datový typ string.

Nyní je vše připraveno k tomu, abychom začali přijímat klienty, začneme tedy naslouchat žádostem o připojení od klientů:

if not listen(s,5) then halt(1);

Druhý parametr funkce listen(2) určuje maximální délku příchozí fronty. Co to přesně znamená není příliš standardizováno a každý operační systém s tímto parametrem nakládá trochu jinak.

A protože již nasloucháme připojením od klientů, mohli bysme je začít přijímat:

while accept(s,client,sin,sout) do begin
  pid:=fork;
  if pid=-1 then halt(2);
  if pid=0 then begin
    reset(sin);
    rewrite(sout);

Voláním accept(2) přijmeme jednoho klienta. Všimněte si, že zde opět používáme specifickou funkci jednotky sockets, která obaluje volání accept(2) a umožňuje nám jednak používat pro adresu klienta typ string a jednak nám rovnou převede návratovou hodnotu volání na dva běžné pascalovské "soubory", sin a sout. Tyto "soubory" poté běžným způsobem otevřeme a pracujeme s nimi. V této části kódu si též můžete všimnout jedné z typických aplikací funkce fork(2) probírané v minulém dílu.

V našem případě s klientem komunikujeme dokud se neodpojí, poté oba "soubory" korektně zavřeme a ukončíme dceřiný proces:

close(sin);
close(sout);
halt(0);

Pokud by zde nebylo volání funkce halt program by pokračoval dál, což by znamenalo že bychom měli dva procesy, které přijímají spojení. Po stránce socketů by to ničemu nevadilo, více procesů může používat jeden socket, ale v našem případě by to způsobilo, že by stále přibývali další procesy. Například webový server apache (napsaný v jazyce C) ve verzi 1.3 pracuje tak, že otevře pro každý port na kterém naslouchá jeden socket, poté provede několik volání fork(2) a volání accept(2) pak provádí více procesů najednou.

Tím jsme prošli celý program serveru, úmyslně jsem vynechal "výkonné jádro", tj. práci se "soubory" sout a sin a cyklus který provádí vlastní otočení řetězce, v těchto částech totiž není nic, co bych považoval za důležité nebo nejasné.

Dnešní ukázkový server má zásadní vadu: můžeme ho ukončit jedině zasláním nějakého ukončovacího signálu (i Ctrl-C je vlastně zaslání signálu, konkrétně SIGINT), který ovšem náš program nijak neošetřuje a tudíž po něm v /tmp zůstane nikam nevedoucí socket, který by měl server správně při ukončení mazat. Na ošetření signálu se případně podíváme v některém z dalších dílů.

Příště se podíváme na klientskou část (která je podstatně jednodušší). A pokud to čas a délka článku dovolí, přepíšeme náš jednoduchý ukázkový program tak, aby pracoval přes internet pomocí protokolu TCP/IP.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=117