LINUXSOFT.cz Přeskoč levou lištu

ARCHIV



   

> Cassandra DB - IV.

Cassandra ke komunikaci s klientem místo textového dotazovacího jazyka preferuje vzdálené voláním procedur. Zjednodušeně řečeno, místo zdrojového kódu typu spojení_s_databází.pošli_dotaz("jméno_operace " + argument.to_string()); se používá kód typu klient.jméno_operace(argument);. Jako infrastruktura pro volání byl zvolen projekt Apache Thrift, který bude v článku v krátkosti popsán. Závěr dílu se věnuje vysokoúrovňovým rozhraním pro jednotlivé jazyky a dalšímu užitečnému softwaru.

16.8.2011 00:00 | František Bártík | Články autora | přečteno 7706×

Apache Thrift

Databáze Cassandra definuje svoje aplikační programátorské rozhraní (API), které se může lišit v závislosti na verzi Cassandry a případných rozšířeních doprogramovaných uživatelem. Nad vlastní databázovou logikou běží server Apache Thrift, který je licencován pod Apache License ve verzi 2. Vzdáleným voláním procedur (remote procedure call, RPC) přes rozhraní Thrift lze přistupovat k API Cassandry. Součástí distribuce Cassandry je soubor /interface/cassandra.thrift, který ve svém vlastními speciálním jazyku popisuje rozhraní příslušné verze Cassandry.

Programování klientské části aplikace vyžaduje definici rozhraní Cassandry ve zvoleném programovacím jazyce, takže rozhraní definované ve speciálním jazyku projektu Thrift se nedá přímo do zdrojového kódu importovat. Aplikace Thrift však umí transformovat definici rozhraní ve svém formátu do definic v podporovaných programovacích jazycí. Přepis se provede příkazem thrift -identifikátor_jazyka soubor_s_rozhraním.thrift (konkrétně např. thrift -php cassandra.thrift). Mezi podporované jazyky patří C++, Java, Python, PHP, Ruby a několik dalších jazyků.

Jazyk Thriftu určuje rozhraní pomocí definic :

  • jmenných prostorů namespace,
  • základních datových typů bool, byte, i16, i32, i64, double a string,
  • speciálního typu binary pro posloupnost surových nekódovaných bytů,
  • kontejnerových typů list, map a set,
  • složených typů struct a enum,
  • jednotlivých služeb (prototypy jednotlivých funkcí),
  • možných výjimek/chyb exception u jednotlivých služeb.
Při transformaci se zachovávají názvy jednotlivých definic v API, takže se jednotlivé části API jmenují ve všech jazycích stejně. Rozhraní Cassandry staví na rozumných jmenných konvencích, takže např. nehrozí kolize s klíčovými slovy některého z jazyků. Při transformaci se použije nejbližší analogický prostředek; například místo map z Thriftu se v Javě použije typ java.util.HashMap.

Ukázka částí cassandra.thrift

Ke zmíněným definicím mohou být přiloženy i komentáře. Soubor cassandra.thrift je velmi dobře komentován, takže tvoří velmi dobrou podrobnou dokumentaci API vámi používané verze Cassandry. Pro ilustraci uveďme tři citace z cassandra.thrift pro verzi 0.8.1.

První ukázka části cassandra.thrift

#
# Interface definition for Cassandra Service
#

namespace java org.apache.cassandra.thrift
namespace cpp org.apache.cassandra
namespace csharp Apache.Cassandra
namespace py cassandra
namespace php cassandra
namespace perl Cassandra

# Thrift.rb has a bug where top-level modules that include modules
# with the same name are not properly referenced, so we can't do
# Cassandra::Cassandra::Client.
namespace rb CassandraThrift

Druhá ukázka části cassandra.thrift

/* describes a column family. */
struct CfDef {
 1: required string keyspace,
 2: required string name,
 3: optional string column_type="Standard",
 5: optional string comparator_type="BytesType",
 6: optional string subcomparator_type,
 8: optional string comment,
 9: optional double row_cache_size=0,
 11: optional double key_cache_size=200000,
 12: optional double read_repair_chance=1.0,
 13: optional list<ColumnDef> column_metadata,
 14: optional i32 gc_grace_seconds,
 15: optional string default_validation_class,
 16: optional i32 id,
 17: optional i32 min_compaction_threshold,
 18: optional i32 max_compaction_threshold,
 19: optional i32 row_cache_save_period_in_seconds,
 20: optional i32 key_cache_save_period_in_seconds,
 21: optional i32 memtable_flush_after_mins,
 22: optional i32 memtable_throughput_in_mb,
 23: optional double memtable_operations_in_millions,
 24: optional bool replicate_on_write,
 25: optional double merge_shards_chance,
 26: optional string key_validation_class,
 27: optional string
row_cache_provider="org.apache.cassandra.cache.ConcurrentLinkedHashCacheProvider",
 28: optional binary key_alias,
}

Třetí ukázka části cassandra.thrift

/* describes a keyspace. */
struct KsDef {
 1: required string name,
 2: required string strategy_class,
 3: optional map<string,string> strategy_options,

 /** @deprecated */
 4: optional i32 replication_factor,

 5: required list<CfDef> cf_defs,
 6: optional bool durable_writes=1,
}
 /**
 Remove data from the row specified by key at the granularity specified by column_path, and the given timestamp. Note
 that all the values in column_path besides column_path.column_family are truly optional: you can remove the entire
 row by just specifying the ColumnFamily, or you can remove a SuperColumn or a single Column by specifying those levels too. */
void remove(1:required binary key,
 2:required ColumnPath column_path,
 3:required i64 timestamp,
 4:ConsistencyLevel consistency_level=ConsistencyLevel.ONE)
 throws (1:InvalidRequestException ire, 2:UnavailableException ue,
3:TimedOutException te),

Jak probíhá předávání dotazu?

Vypišme všechny fáze od vygenerování a odeslání dotazu na straně klienta.

  • Uživatelský kód rozhodne o zavolání databáze, připraví a nastaví požadované parametry a zavolá dotaz.
  • Vygenerovaný kód přepíše volání do formy, které Thrift rozumí.
  • V dalším kroku se požadavek serializuje na vrstvě Tprotocol. Možné implementace TBinaryProtocol, TCompactProtocol, TDebugProtocol, TDenseProtocol, TJSONProtocol a TSimpleJSONProtocol se liší svými vlastnostmi a pochopitelně i svým výkonem.
  • V dalším kroku vrstva TTransport připraví dotaz k přenosu. Na výběr jsou implementace TFileTransport, TFramedTransport, TSocket a TZlibTransport.
  • Dotaz se přenese k Thrift serveru přes síťové rozhraní.
Odpověď je zpracována stejným způsobem pouze v opačném pořadí.

Ukázka použití

Část dílu věnovanou Thriftu uzavírá ukázkový javovský kód. Vynechány jsou nutné importy org.apache.cassandra.thrift.Cassandra, org.apache.cassandra.thrift.ConsistencyLevel, org.apache.cassandra.thrift.Clock, org.apache.cassandra.thrift.ColumnParent, org.apache.thrift.protocol.TBinaryProtocol..., import definic výjimek a odchytávání výjimek.

//vytvoření spojení s databází
TFramedTransport my_tf = new TFramedTransport(new TSocket("localhost", "9190"));
Cassandra.Client my_client = new Cassandra.Client(new TBinaryProtocol(my_tf));
my_tf.open();

//zvolení používaného keyspace a odkazu na používanou cf
client.set_keyspace("jméno keyspace");
ColumnParent my_cp = new ColumnParent("jméno cf");

//vložení záznamu
Clock casove_razitko = new Clock(System.currentTimeMillis());
client.insert("jméno řádku".getBytes(),
 my_cp,
 new Column("jméno sloupce".getBytes(UTF8), "hodnota".getBytes(), casove_razitko),
 ConsistencyLevel.ONE);
client.insert("jméno řádku".getBytes(),
 my_cp,
 new Column("jméno jiného sloupce".getBytes(UTF8), "jiná hodnota".getBytes(), casove_razitko),
 ConsistencyLevel.ONE);

Další nástroje podporované Cassandrou

Serializační RPC software Apache Avro se podobá Thriftu. V některých ohledech Avro Thrift překonává a možná v budoucích verzích Cassandry se stane preferovaným RPC řešením. Podporované jazyky jsou Java, C, C++, Python a Ruby.

Cassandra query language (CQL) představuje nový prostředek komunikace s databází. Tato novinka je dostupná pouze v poslední řadě Cassandry 0.8. Principy práce CQL se shodují s SQL a i syntaxe CQL se silně inspiruje syntaxí SQL. Na oficiálních stránkách Cassandry naleznete ovladače pro Java (JDBC), Python (DBAPI2) a Python (Twisted).

Standardní administrátorská konzole cassandra-cli a nástroj nodetools byly zmíněny již v předchozích dílech.

Různý další software

Cassandra-webconsole je J2EE (JRE 6.0+) aplikace pro servletový kontejner Tomcat. Webové rozhraní cassandra-webconsole usnadňuje a zpřehledňuje administraci databáze Cassandra.

Pyssandra je vysokoúrovňový klient Cassandry pro jazyk Python.

Hector je velmi populární všestranný javovský client pro Cassandru. Hector mimo jiné nabízí vysokoúrovňové rozhraní, podporu Java Management Extensions (JMX), connection pooling, jednoduché ORM... Všimněme si, že jméno Hector je jedním z mnoha označení ze starořeckých dějin spojovaných s databází Cassandra.

Chiton je další API rozhraní pro Python.

Pelops je další API rozhraní pro Javu.

Knihovna phpcassa zpřístupňuje databázi Cassandra z php skriptů.

Telephus je další rozhraní pro Python, které staví na frameworku Twisted.

Kundera je jednoduchý ORM framework pro Javu, který jako úložiště využívá Cassandru.

Twissandra je ukázkový kód, který demonstruje nasazení databáze Cassandra. Twissandra předvádí, jak naprogramovat webovou službu podobající se sociální síti Twitter. Twissandra byla portována do více programovacích jazyků a frameworků.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

28.11.2018 23:56 /František Kučera
Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1

12.11.2018 21:28 /Redakce Linuxsoft.cz
22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář

6.11.2018 2:04 /František Kučera
Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

4.10.2018 21:30 /Ondřej Čečák
LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář

18.9.2018 23:30 /František Kučera
Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

9.9.2018 14:15 /Redakce Linuxsoft.cz
20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business. Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

31.7.2023 14:13 / Linda Graham
iPhone Services

30.11.2022 9:32 / Kyle McDermott
Hosting download unavailable

13.12.2018 10:57 / Jan Mareš
Re: zavináč

2.12.2018 23:56 / František Kučera
Sraz

5.10.2018 17:12 / Jakub Kuljovsky
Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2024) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze