Dnes se podíváme na zápis proměnných a konstant, dojde i na escape sekvence.
21.9.2004 15:00 | Jan Němec | přečteno 83192×
V minulém dílu jsme probrali základní číselné typy. Abychom je mohli využít, musíme definovat proměnnou. Ukážeme si to v následujícím příkladu.
/* globální proměnné typu double */ double d1, d2; int main(void) { /* lokální proměnné typu int*/ int j; int i = 0; d1 = 1.5; j = i; return j; }
Definice může být globální, nebo lokální. Globálně (mimo funkci) jsou definované dvě proměnné typu double, jmenují se d1 a d2. Využít je můžu všude, kde o nich překladač ví, což v našem případě znamená od definice dál. Lokální i a j jsou platné pouze ve funkci main. V C lze lokální proměnné definovat pouze na začátku bloku, není tedy možné nejprve provést příkazy jako například přiřazení nebo volání jiné funkce, a teprve potom definovat proměnnou. Blok je kód mezi párem složených závorek, v našem případě celé tělo funkce. Pokud jsou definovány lokální a globální proměnné stejného jména, lokální identifikátor překryje globální, ale v praxi by k tomu nemělo docházet, neboť rozumný programátor se této situaci raději vyhne. Všimněte si, že se nejdřív píše typ, a teprve potom název proměnné. Céčko (podobně jako Unix) rozlišuje malá a velká písmena, a to jak u klíčových slov, tak i u identifikátorů. Nelze tedy psát INT místo int, Return místo return a podobně. Všechna klíčová slova a názvy funkcí ze standardní knihovny se píší malými písmeny. Uživatelské identifikátory toto omezení nemají, můžeme tedy klidně definovat proměnné s velkými písmeny v názvu. Lze dokonce vytvořit proměnné, které se liší pouze velikostí písmen, například Soucet a soucet, ale pochopitelně tím utrpí přhlednost programu. Identifikátor může obsahovat malá a velká písmena anglické abecedy, podtržítko a také číslice, nesmí ovšem číslicí začínat.
Do proměnné lze přiřadit hodnotu rovnítkem, a to buď přímo v definici, nebo v příkazu. První případ se nazývá inicializace a v našem příkladu jsme takhle nastavili proměnnou i. Druhý případ se týká proměnných d1 a j. Je dobré si uvědomit, že znak = znamená přiřazení, nikoli porovnání.
Celočíselné konstanty lze zapsat ve třech soustavách.
Soustava | Příklady | Charakteristika |
Osmičková | 0, 0777, 024 | Začíná nulou, nenásleduje x, X |
Desítková | 1, 94, 24 | Nezačíná nulou |
Šestnáctková | 0xFF, 0X5e, 0x24 | Začíná 0x nebo 0X |
V šestnáctkové soustavě nezáleží na velikosti písmen. Trochu nešťastná je volba úvodní nuly u osmičkové soustavy, kvůli tomu například nelze desítková čísla zarovnávat zleva nulami na jednotnou velikost. Nelze psát čísla ve dvojkové soustavě, což by se někdy hodilo. Typ konstanty se určí implicitně (obvykle to bude int) nebo lze vynutit unsigned a long příponou U, u a L, l. Můžeme tak psát 65567L, 2145644u a podobně, ale není to příliš časté.
Reálné konstanty se píší v desítkové soustavě a buď s desetinou tečkou (2.4, 0.145, .24, 87.), nebo v exponenciální formě (4e2, 45E-5). Typ lze vynutit float nebo long double příponou F, f nebo L, l.
Znaky lze psát pomocí apostrofů, například 'a', 'B', 'č', tří osmičkových číslic, například '\001', '\077', '\644' (což v případě jednotlivého znaku nemá příliš význam, můžu rovnou použít příslušné číslo reprezentující daný znak, tj. obvykle ASCII hodnotu) nebo escape sekvencev v apostrofech.
Sekvence | Význam |
'\\' | Zpětné lomítko |
'\'' | Apostrof |
'\a' | Zvonek |
'\b' | Backspace |
'\f' | Nová stránka |
'\n' | Odřádkování, LF |
'\r' | Na začátek řádky, CR (v DOSových txt souborech) |
'\t' | Tabelátor |
Znak uvozovky lze zapsat prostě takhle '"', není tedy třeba escapovat.
S řetězcovou konstantou jako parametrem funkce puts jsme se již setkali v minulém dílu. Píší se do uvozovek a lze v nich použít i stejné sekvence jako v případě jednotlivých znaků. Rozdíl je jen v tom, že místo znaku apostrofu se musí zaescapovat uvozovka.
Řetězec v C | Význam |
"Ahoj světe!" | Ahoj světe |
"" | |
"Znak ' lze zapsat" | Znak ' lze zapsat |
"Znak \" nikoli" | Znak " nikoli |
"Nový\nřádek" | Nový řádek |
"Hrozně" "Dlouhý" "Řetězec" | HrozněDlouhýŘetězec |
"Nula\000ukončuje" | Nula |
Prvních pět příkladů z tabulky jsem již vysvětlil, v předposledním dokumentuji docela příjemnou vlastnost Céčka. Několik po sobě jdoucích řetězcových konstant je chápáno jako jeden řetězec vzniklý jejich složením, typické využití může vypadat třeba takhle:
puts( "V programu došlo k chybě.\n" "Ozvěte se autorovi na adresu autor@program.cz\n" "Děkuji." ); return 1;
Toto jednoduché skládání řetězců se dá uplatnit pouze na konstanty.
Nejdůležitější je poslední příklad. Řetězec v C je ve skutečnosti ukazatel do paměti. Při zápisu řetězcové konstanty se vyhradí kus paměti (alespoň) o jeden byte větší než délka řetězce, který se do ni zkopíruje. Jednomu znaku odpovídá jeden byte paměti. Za vlastní text se uloží nula, která řetězec ukončuje. Pokud pak konstantu použiju (třeba jako parametr funkce puts), jde ve skutečnosti o ukazatel na začátek vyhrazeného kusu paměti. V posledním příkladu jsem vložil nulu přímo do řetězce. To mi Céčko umožní, ale pokud jej použiju v jakékoli standardní funkci, interpretovat se bude pouze text až po nejbližší nulu, která bude (mylně) pokládána za ukončovací. Příklad přesto má smysl, existují totiž knihovny s funkcemi, které jako parametr požadují nebo alespoň akceptují řetězec s nulovým znakem, délka se pak musí zadat nějak jinak, typicky jako další parametr. Ve standardní knihovně se s žádnou takovou funkcí nesetkáte.
V dalším díle se podíváme na nejznámější C funkci printf.