Linux Software

PostgreSQL (15) - Transakce

Transakce patří k základním mechanismům práce s daty na databázovém serveru, zejména pak při aktivních operacích (UPDATE, INSERT, DELETE).

30.8.2005 06:00 | MaReK Olšavský | czytane 21278×

RELATED ARTICLES KOMENTARZE

K čemu slouží transakce

Při jakékoliv operaci může dojít k chybě při práci s daty, ať již pádem serverové služby, nebo špatně položeným dotazem. Teoreticky se při SELECTu tak mnoho neděje, jen aplikace nezíská všechna potřebná data, ale při zadávání nových záznamů, jejich změnách, či mazání by mohl nastat velmi závažný problém s integritou dat.

Modelový příklad může být změna změna cen v elektronickém obchodě, například z konkurenčních důvodů. Po zadání příkazu UPDATE products SET price = price / 1.01, což je zlevnění veškerého zboží o 1% může v chodu serveru nastat chyba, například při aktualizaci 1028 položky z 9000. Pokud nejsou použity transakce, bude aktualizováno právě těch prvních 1027 položek, ale další zůstanou neaktualizovány. Aplikace se dozví, že nastala chyba a pokusí se tuto aktualizaci spustit znovu, takže těch prvních 1027 položek bude 2x zlevněno o 1%. Dalo by se tomuto předejít použitím timestampu, kdy další pokus by aktualizoval data, která by měla starší (třeba o 1 hodinu) datum aktualizace, než je poslední timestamp.

Popisovaný příklad navíc nepočítá se změnami, které mohou probíhat na dalším připojení k databázi z aplikace spuštěné na jiném počítači. Například z jiného místa bude změněn popis zboží, čiže timestamp by mohl nasvědčovat tomu, že cena již byla aktualizována byla.

Tyto problémy se řeší jednodušeji, než se zdá, pomocí tzv. transakčního zpracování, které je sice o malinko pomalejší, ale odolná vůči těmto problémům. Transakce v podstatě zajišťují, že pokud není příkaz provedený do konce korektně a není tudíž potvrzen, nejsu změny přístupné v následujících příkladech. V příkladě, který byl napsán o několik řádků výše to znamená, že pokud nastane chyba, když bude mechanismus db serveru aktualizovat 1028 řádek, tak nebude uloženo ani těch prvních 1027 řádek se změněnou cenou.

Každý příkaz, který je odeslán na PostgreSQL server je "obalen" v samostatné transakci, a pracuje nad obrazem dat, který byl k dispozici v momentě zahájení transakce. Trochu problém by mohl nastat pokud by měnění dat bylo prováděno z vícero míst současně, protože by server nemusel být schopen sestavit správně všechny změny, které byly zadány, takže v tomto místě k transakcím ještě přistoupí zamykání tabulek, se kterými se seznámíme v příštím díle.

Transakční módy a módy čtení

PostgreSQL server nabízí několik módů, ve kterých může data zpracovávat v transakcích (pro ty jsou módy 4) a další 3 módy pro čtení.

Módy transakcí:

READ COMMITTED - Základní mód PgSQL, kdy dotaz čte pouze data z ukončených/potvrzených transakcí. Pokud během čtení je některá z transakcí ukládajících, či měnících, data potvrzena, tento SELECT je neuvidí.
READ UNCOMMITTED - Chová se stejně, jako READ COMMITED, je zde jen z důvodu kompatibility s SQL standardem. V původní verzi má číst i data, která ještě nemají potvrzené transakce (v případě nepotvrzeného DELETE jsou vynechány řádky, které mají být vymazány).
SERIALIZABLE - Nejčistší a nejbezpečnější forma transakčního zpracování. Server nepovolí paralelně přes sebe běžící transakce, ale řadí jednu za druhou. V tomto módu je nutné mít aplikaci připravenu na opakování transakce (bloku příkazů), když bude serverem změna zamítnuta.
REPEATABLE READ - V PgSQL má stejné chování, jako SERIALIZABLE, je opět pouze kvůli kompatibilitě s SQL std. V normované verzi příkaz SELECT zpracuje a vrátí aplikaci pouze data, která jsou potvrzená, přičemž, ale doběhne-li některá transakce měnící data, je tento blok znovu SELECTEM zpracován a zařazen do návratových dat.

Módy čtení:

DIRTY READ - Transakce čte data, která nejsou ještě potvrzená v jiné transakci.
NONREPEATABLE READ - Transakce znovu načte data, která byla načtena při prvním čtení z tabulky a najde data, která byla mezitím potvrzena z jiné transakce.
PHANTOM READ - Transakce znovu vykonná dotaz vracející množinu řádek odpovídající vyhledávací podmínce a najde řádky, které byly mezitím z jiné transakce potvrzeny, jako zpracované.

Aby vše nebylo úplně jednoduché, není možné kombinovat módy transakcí s módy čtení kombinovat zcela libovolně, ale PgSQL si tuto režii, který mód bude použit zařizuje sám, jen na základě nastaveného transakčního módo. Tabulka, z originální dokumentace, ukazuje, které módy transakcí a čtení nesmí být zkombinovány a z těch povolených je už jen na serveru, který použije.

Seskupení příkazů do transakce

PostgreSQL server pracuje v tzv. Autocommit módu, kdy každý příkaz je "obalen" ve své vlastní transakci, čímž je předejíto možnosti chyb, která byla naznačena v modelovém příkladě. V řadě případů je nutné mít explicitně v jedné transakci několik SQL příkazů. K tomu slouží pár příkazů BEGIN a END, kterými se blok příkazů obalí.

Příkaz BEGIN má několik doplňkových parametrů, čiže jeho výsledný tvar má následující možnosti: BEGIN [WORK | TRANSACTION] [ISOLATION LEVEL transaction_mode [, ...]], kde klíčová slova WORK a TRANSACTION jsou volitelné parametry, které jsou bezvýznamové, ale v souladu s normou, pokud je transakce započata například, jako WORK, musí být takto i ukončena. Parametr transaction_mode má některou z hodnot READ COMMITTED, READ UNCOMMITTED, SERIALIZABLE a REPEATABLE READ, které byly vysvětleny v předchozí kapitolce, další volitelné prarametry, které jsou spjaty s ISOLATION LEVEL transaction_mode a jsou volitelné jsou READ ONLY a WRITE ONLY, které určují, pro kterou část práce s daty patří v danné transakci mód. Ekvivalentem tohoto příkazu, včetně stejných parametrů, jen neobsahující jedno z dvojice klíčových slov WORK a TREANSTACTION.

Pro ukončení transakce jsou k dispozici 2 příkazy, jeden pro potvrzení transakce, který se jmenuje COMMIT [WORK | TRANSACTION] a druhý je ROLLBACK [WORK | TRANSACTION], který slouží pro zrušení transakce, tudíž veškeré změny jsou zahozeny. Tyto příkazy jsou posílány z aplikace, takže není problém kdykoliv v průběhu práce s daty, nebo při chybě odchycené v aplikaci, transakci zrušit. Pro vysvětlení: při nastartování transakce z aplikace, a zadávání dalších příkazů z této, server standardně reaguje například na chybně zadaná data (řetězec do čísla, ...), takže chyba je oznámena standardním mechanismem aplikaci, tudíž je možné na ní zareagovat, například zrušením transakce.

Užitečnou vlastností při používání transakcí je možnost vytvořit si návratové body, tzv. SAVEPOINTs. Vytvářejí se klíčovým slovem SAVEPOINT jmeno, kde jméno savepointu je plně v rukou programátora a je povinným parametrem. Pro zrušení všech změn (rollback), které se udály mezi nastavením návratového bodu a se používá příkaz ROLLBACK TO SAVEPOINT jmeno, přičemž transakce zůstane běžící, jen jsou zrušeny změny k tomuto návratovému bodu. Pokud je v aplikaci návratový bod již nepotřebný, lze jej zrušit příkazem RELEASE SAVEPOINT jmeno.

Kromě výše uvedených příkazů lze pro všechny operace používat "centrální" nastavení vlastností transakcí příkazem SET TRANSACTION transaction_mode [, ...], kde transaction_mode je jeden z módů, uvedených v předchozí kapitolce a je možný přídavný parametr READ ONLY, nebo WRITE ONLY, jehož význam je stejný, jako u BEGIN/START TRANSACTION. Tímto příkazem se nastaví transakce pro jedno sezení, poté je stačí pouze startovat a ukončovat. Pokud je tento příkaz odeslán při již otevřené/spuštěné transakci, nemá žádný vliv na její průběh.

Dodatky k transakcím

Transakce, tak jak je nabízí PgSQL nejsou ekvivalentní k možnostem, které má MySQL, dokonce ta je nemá na svých MyISAM tabulkách, ale je třeba použít InnoDB tabulky. V MySQL znamená přechod na InnoDB tabulky dokonce zpomalení celé databáze, bohužel.

Byť je režie transakcí pro databázi zpomalující, může být soustředění několika příkazů do jedné transakce přínosné pro výkon databáze jako takové, vůči stavu bez jejich použití. Jak bylo napsáno, PgSQL pracuje v tzv. Autocommit módu, tj. je-li na server posláno několik nesouvisejících příkazů (čiže logicky by nebylo třeba je obalovat startem a ukončením transakcí), jsou tyto vykonávány jeden za druhým s tím, že pro každý extra je otevírána a potvrzována transakce, ale v případě že je explicitně nastartována transakce, jsou vykonány všechny změny, které jsou do ní promítnuty teprve po jejím potvrzení.

Transakce přináší také vyšší nároky na diskový prostor. V případě, že má databáze 800 MB a příkazy seskládanými v transakci bude ovlivněno 500MB, je třeba mít volných těchto 500MB v paměťovém/diskovém prostoru serveru.

--Jednoduse nastartovana a potvrzena transakce
BEGIN TRANSACTION ISOLATION LEVEL READ COMMITTED;
UPDATE products SET unitprice = unitprice / 1.01;
DELETE FROM products WHERE unitprice<5.00;
COMMIT TRANSACTION

--Nastartovana a zamitnuta transakce
START TRANSACTION ISOLATION LEVEL READ COMMITTED;
UPDATE products SET unitprice = unitprice / 1.01;
DELETE FROM products WHERE unitprice>1000.00;
ROLLBACK TRANSACTION

--Pouziti savepointu
SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
START TRANSACTION;
SAVEPOINT muj_navrat;
UPDATE products SET unitprice = unitprice * 2;
ROLLBACK TO SAVEPOINT muj_navrat;
SAVEPOINT muj_navrat;
UPDATE products SET unitprice = unitprice * 1.02;
RELEASE SAVEPOINT muj_navrat;
DELETE FROM products WHERE unitprice>1000.00;
ROLLBACK TRANSACTION;

Tyto příklady jsou jen na to, jak mohou být příkazy za sebou seskládány, ale většinou budou tyto posílány z aplikace, čiže bude možná interakce s chybami, které vrátí PgSQL server do aplikace, případně reakce na chyby uživatele aplikace při změnách dat.

Závěrem

Cílem tohoto dílu bylo seznámit se s transakcemi a jejich použitím. V příštím díle bude probráno zamykání tabulek, čímž lze dopomoci k vyšší úrovni integrity dat.

KOMENTARZE

Doplnění - zpomalování

19.5.2006 23:38

Lukáš Zapletal

Dotaz na funkci transakci

18.9.2006 13:24

Tomk

Re: Dotaz na funkci transakci

18.9.2006 15:27

Aleš Hakl

Re: Dotaz na funkci transakci

18.9.2006 17:35

Petr Zajíc

Re: Dotaz na funkci transakci

18.9.2006 17:41

Aleš Hakl

Re: Dotaz na funkci transakci

18.9.2006 22:57

Petr Zajíc

Re: Dotaz na funkci transakci

19.9.2006 08:57

Tomk

Re: Dotaz na funkci transakci

19.9.2006 21:59

Petr Zajíc

Re: Dotaz na funkci transakci

19.9.2006 23:49

Aleš Hakl

Tylko zarejestrowani użytkownicy mogą dopisywać komentarze.

Szukanie oprogramowania

Latest aktual Distributions

1.	Pacman linux Download: 5778x
2.	FreeBSD Download: 10005x
3.	PCLinuxOS-2010 Download: 9500x
4.	alcolix Download: 12050x
5.	Onebase Linux Download: 10742x
6.	Novell Linux Desktop Download: 0x
7.	KateOS Download: 7189x

Latest aktual Software

1.	xinetd Download: 3328x
2.	RDGS Download: 937x
3.	spkg Download: 6342x
4.	LinPacker Download: 11584x
5.	VFU File Manager Download: 3945x
6.	LeftHand Mała Księgowość Download: 8270x
7.	MISU pyFotoResize Download: 3653x
8.	Lefthand CRM Download: 4475x
9.	MetadataExtractor Download: 0x
10.	RCP100 Download: 4009x
11.	Predaj softveru Download: 0x
12.	MSH Free Autoresponder Download: 0x

linuxsoft.cz | Design: www.megadesign.cz