Dnešní díl věnujeme, jak jsem slíbil, síťové komunikaci. Ta tradičně v unixových systémech probíhá prostřednictvím tzv. socketů. Budeme se držet dělení knihovny Free Pascalu a dnes začneme s komunikací obecnými sockety, konkretně v rámci jednoho unixového počítače.
28.4.2004 08:00 | Aleš Hakl | read 14825×
DISCUSSION
Socket (v některé česky psané literatuře též označován "schránka") je abstraktní reprezentace nějakého
komunikačního kanálu. Tento mechanismus byl navržen na počátku
80. let v Berkeley během implementace TCP/IP
do BSD. I
přesto, že jsou sockety odjakživa spojeny s protokolem TCP/IP a
internetem, jedná se o velmi obecnou vrstvu, kterou lze beze
změn rozhraní použít pro komunikaci v rámci jednoho stroje
(tzv. Unix domain sockets, které budeme později v
článku používat), přes internet protokoly IPv4 nebo IPv6, v
síťích AppleTalk nebo DECnet nebo například takzvaným Packet
Radiem protokolem X.25 nebo jeho radioamatérskou variantou
AX.25. Pravdou je, že se nejedná o zrovna elegantní řešení a v
unixovém systému sockety působí spíše jako pěst na oko. Mnohem
elegantněji síťovou komunikaci řeší "pokračování" unixu,
operační systém Plan9. Zanechme ovšem
teoretizování a vrhněme se na vlastní pascal:
Práci se sockety zajišťuje standardní(pro Free Pascal) jednotka
sockets, ta obsahuje wrappery prakticky všech funkcí
známých jako tzv. BSD Sockets. Programátory pro
majoritní operační systém jistě potěší, že se jednotka chová jako
BSD varianta i pokud používá WinSock (tj. nemusíte
volat nějaké ty dvě šílené funkce ^_^). Dále v této knihovně
nalezneme přetížené funkce, které mnohé standardní volání
přibližují pascalské představě.
Dnes se podíváme na jeden z nejjednodušších případů použití
socketů, na proudovou komunikaci v rámci jednoho (unixového)
stroje, tzv. Unix Domain Sockets. Zde se jako adresy
používají názvy souborů, přičemž tyto soubory existují na
disku:
srwxr-xr-x 1 dfox dfox 0 2004-04-26 10:53 ukazkovySocket
Dnešní příklad se bude skládat ze serveru a klienta. Server
vytvoří socket
/tmp/ukazkovySocket a bude čekat na
spojení od klienta. A klient se k tomuto socketu připojí a bude
serveru posílat řádky textu od uživatele, které server otočí a
pošle zpět (chtěl jsem aby server dělal alespoň něco a nic
vhodnějšího mě nenapadlo ^_~).
Začneme s rozborem serverové části. Nejprve vytvoříme socket:
s:=socket(AF_UNIX,SOCK_STREAM,PF_UNIX);
if s=-1 then begin
halt(1);
end;
Funkce socket(2), která vytvoří nový socket, přijímá
jako parametry doménu socketu (AF_UNIX, nebo
například AF_INET pro IPv4), jeho typ
(SOCK_STREAM pro obousměrné proudové spojení - jako protkol
TCP, nebo například SOCK_DGRAM pro datagramové
spojení - v případě IP se jedná o protokol UDP). Poslední
parametr udává protokol, nejčastěji je shodný s doménou a
většinou můžeme místo něj uvést hodnotu 0. Funkce vrátí buďto
deskriptor socketu, nebo -1 v případě chyby.
Dále svážeme náš socket s nějakou cestou v souborovém systému:
unlink(fileName);
if not bind(s,fileName) then halt(1);
Nejprve smažeme případný původní
objekt
s danou cestou voláním
unlink(2) z jednotky
linux. Poté se pokusíme svázat náš socket s touto cestou pomocí
bind(2), pokud toto volání selže, funkce vrátí
hodnotu
false a náš program končí. Tento způsob
volání funkce
bind(2) jistě přijde programátorům v
jazyce C poněkud zvláštní, jedná se totiž o funkci v jednotce
sockets, která obaluje volání
listen(2)
aby bylo možno pro doménu
AF_UNIX používat jako
adresu rovnou datový typ
string.
Nyní je vše připraveno k tomu, abychom začali přijímat klienty,
začneme tedy naslouchat žádostem o připojení od klientů:
if not listen(s,5) then halt(1);
Druhý parametr funkce
listen(2) určuje maximální
délku příchozí fronty. Co to přesně znamená není příliš
standardizováno a každý operační systém s tímto parametrem
nakládá trochu jinak.
A protože již nasloucháme připojením od klientů, mohli bysme je
začít přijímat:
while accept(s,client,sin,sout) do begin
pid:=fork;
if pid=-1 then halt(2);
if pid=0 then begin
reset(sin);
rewrite(sout);
Voláním accept(2) přijmeme jednoho klienta. Všimněte
si, že zde opět používáme specifickou funkci jednotky
sockets, která obaluje volání accept(2) a
umožňuje nám jednak používat pro adresu klienta typ
string a jednak nám rovnou převede návratovou hodnotu
volání na dva běžné pascalovské "soubory", sin a
sout. Tyto "soubory" poté běžným způsobem otevřeme a
pracujeme s nimi. V této části kódu si též můžete všimnout jedné
z typických aplikací funkce fork(2) probírané v
minulém dílu.
V našem případě s klientem komunikujeme dokud se neodpojí, poté
oba "soubory" korektně zavřeme a ukončíme dceřiný proces:
close(sin);
close(sout);
halt(0);
Pokud by zde nebylo volání funkce
halt program by
pokračoval dál, což by znamenalo že bychom měli dva procesy,
které přijímají spojení. Po stránce socketů by to ničemu
nevadilo, více procesů může používat jeden socket, ale v našem
případě by to způsobilo, že by stále přibývali další
procesy. Například webový server
apache (napsaný v jazyce
C) ve verzi 1.3 pracuje tak, že otevře pro každý port na kterém
naslouchá jeden socket, poté provede několik volání
fork(2) a volání
accept(2) pak provádí
více procesů najednou.
Tím jsme prošli celý program serveru, úmyslně jsem vynechal
"výkonné jádro", tj. práci se "soubory" sout a
sin a cyklus který provádí vlastní otočení řetězce, v
těchto částech totiž není nic, co bych považoval za důležité
nebo nejasné.
Dnešní ukázkový server má zásadní vadu: můžeme ho ukončit jedině
zasláním nějakého ukončovacího signálu (i Ctrl-C je vlastně zaslání signálu,
konkrétně SIGINT), který ovšem náš program nijak neošetřuje a
tudíž po něm v /tmp zůstane nikam nevedoucí socket, který by měl
server správně při ukončení mazat. Na ošetření signálu se
případně podíváme v některém z dalších dílů.
Příště se podíváme na klientskou část (která je podstatně
jednodušší). A pokud to čas a délka článku dovolí, přepíšeme
náš jednoduchý ukázkový program tak, aby pracoval přes internet
pomocí protokolu TCP/IP.