Pojednání o kontejnerech by nebylo úplné, kdybychom vynechali algoritmy, které
nad nimi pracují. Také se podíváme na nové (a vesměs příjemné) věci, které
se do The Collections Framework dostaly v Javě 5.0.
26.4.2005 06:00 | Lukáš Jelínek | přečteno 74718×
Implementace algoritmů pro práci s kolekcemi jsou shromážděny ve třídě
Collections
převážně jako statické metody. Jsou obecně navrženy tak, aby
bez ohledu na implementaci kontejneru zajišťovaly minimální operační
složitost (i za cenu vyšší spotřeby paměti).
Máme nějaký obecný seznam (tj. nějakou implementaci rozhraní List
) a potřebujeme
ho seřadit. K tomuto účelu máme k dispozici dvě statické metody sort()
,
jedna řadí pouze porovnatelné prvky, druhá jakékoli - s tím, že
poskytneme nějaký komparátor. Obě používají upravený algoritmus mergesort,
řazení probíhá v čase n.log(n)
a je stabilní. Podívejme se, jak to vypadá:
List list = new ArrayList(); // vytvoření seznamu ... // naplnění atd. Collections.sort(list); // seřazení
Opakem seřazení je náhodné zamíchání seznamu. I to se může občas hodit (a to
nejen v případě, že chceme přehrávat písničky v náhodném pořadí). I zde jsou
metody dvě (shuffle()
), jedna používá standardní, druhá uživatelský generátor
náhodných čísel. Pracují v lineárním čase.
List list = new LinkedList(); // vytvoření seznamu ... // naplnění atd. Collections.shuffle(list); // promíchání
Opět velmi jednoduchá, avšak užitečná činnost. Poskytuje ji metoda reverse()
,
pracující opět v lineárním čase.
Podobně jako u polí, i u seřazených seznamů může s úspěchem použít hledání
binárním dělením. Pro seznamy s možností náhodného přístupu (tj. implementující
rozhraní RandomAccess
) pracuje v čase log(n)
, pro ostatní bude čas řádově
lineární.
List list = new ArrayList(); // vytvoření seznamu list.add("abc"); // vložíme prvky list.add("efg"); list.add("cde"); Collections.sort(list); // seřazení System.out.print("Hledaný řetězec má pozici "); System.out.println(Collections.binarySearch(list, "efg")); // vypíše "2"
Opět zjevná analogie s poli, co k tomu říci více...
List list = new ArrayList(); // vytvoření seznamu list.addAll(Collections.nCopies(100, new Double(3.3))); // první naplnění Collections.fill(list, new Double(5.0)); // další naplnění
Zkopírovat seznam lze v zásadě třemi cestami. Jednou je vytvoření úplně nového
seznamu pomocí "kopírovacího" konstruktoru (v uvozovkách proto, že zde nejde
o skutečný kopírovací konstruktor). Tím se vytvoří nový seznam
obsahující prvky toho původního (resp. obecněji, prvky libovolné kolekce
implementující rozhraní Collection
).
List list1 = new ArrayList(); // vytvoření prvního seznamu ... // nějaké operace List list2 = new LinkedList(list1); // nový seznam obsahuje všechny prvky původního
Druhou možností je volání statické metody copy()
s obdobným
efektem jako u polí, tedy se zkopírováním jen určitých prvků (aniž by ostatní
byly dotčeny). Nový seznam musí být vytvořen předem. Pozor, jako první argument
se uvádí cílový seznam, zdrojový až jako druhý.
List list1 = new ArrayList(); // vytvoření prvního seznamu ... // nějaké operace List list2 = new LinkedList(); // vytvoření druhého seznamu Collections.copy(list2, list1); // kopírujeme
Třetí způsob není v podstatě skutečné kopírování, vytváří totiž pouze pohled
na tentýž seznam (při modifikaci se mění data v nové i v původním seznamu).
Používáme metodu subList()
, kterou získáme seznam stejného typu, jako byl ten
původní.
List list1 = new ArrayList(); // vytvoření prvního seznamu ... // nějaké operace List list2 = list1.subList(0, 10); // získání podseznamu list2.set(0, list2.get(1)); // zkopíruje prvek z pozice 1 na pozici 0 (v obou seznamech!)
Běžné kolekce lze převádět na normální pole dvojicí metod toArray()
. Metody
se liší tím, že jedna vytvoří pole s prvky typu Object
, zatímco druhá pole
prvků určeného typu. Více napoví příklad. Pozor - kromě určení typu je nutné
vrácené pole vždy ještě přetypovat na správný typ (na to se často zapomíná)!
Navíc je chování ovlivněno tím, jaké pole se metodě předá - pokud je alespoň
stejně velké jaké daná kolekce, naplní se prvky (případné přebytečné pozice
se nastaví na null
), v opačném případě se vytvoří úplně nové pole.
List list = new ArrayList(); // vytvoření seznamu Object oa[] = list.toArray(); // převedení na pole objektů String sa[] = (String[]) list.toArray(new String[0]); // převedení na pole řetězců
Opačným případem je vytvoření seznamu (nebo jiné kolekce) z pole. K tomu
slouží statická metoda asList()
ze známé třídy Arrays
. Ta vytvoří nový seznam,
který je ovšem jen vnějším rozhraním k původnímu poli - je tedy neměnný.
Pokud chceme vytvořit modifikovatelný seznam nebo nějakou jinou kolekci,
musíme vytvořený seznam předat konstruktoru nového kontejneru.
String sa[] = new String[10]; // vytvoření pole ... // naplnění apod. List list = Arrays.asList(sa); // vytvoření neměnného seznamu nad polem list.add("bbbb"); // nelze - způsobí výjimku UnsupportedOperationException list = new List(list); // zkopírujeme seznam list.add("bbbb"); // tohle už lze
Ve třídě Collections
existuje skupina statických metod, zabývajících se
zjišťováním různých informací o prvcích obsažených v kontejnerech. O nich
si povíme jen stručně.
Máme zde metody min()
a max()
, každou ve dvou variantách (bez uvedení
komparátoru a s ním). Již z jejich názvu vyplývá, že budou zjišťovat
největší a nejmenší prvek. Ovšem pozor na to, že pro prázdné kolekce vyhodí
výjimku NoSuchElementException
!
Set set = new HashSet(); ... System.out.println("Minimum: " + Collections.min(set)); System.out.println("Maximum: " + Collections.max(set));
Dvojice metod indexOfSubList()
a lastIndexOfSubList()
zjišťuje první, resp.
poslední místo výskytu podseznamu v seznamu. Pokud žádný podseznam nenajde,
vrátí -1
.
Seznam můžeme "zrotovat" o určitý počet pozic. Použijeme k tomu metodu
rotate()
. Dále lze prohodit dva prvky v seznamu metodou swap()
nebo pomocí
replaceAll()
nahradit všechny výskytu určitého prvku. K dalším algoritmům
se dostaneme za chvíli, jsou totiž k dispozici až od JDK 1.5.
Java 5.0 (tedy JDK 1.5) přináší dost podstatné změny v rozhraní i implementaci kolekcí. Byly tak vyslyšeny časté stížnosti některých programátorů na napříliš bezpečný způsob práce s kolekcemi, na složité používání primitivních typů a další problémy. Současně přibyly některé funkce, které usnadňují práci s kontejnery. Podívejme se tedy blíže...
Programátoři v C++ jsou zvyklí, že pokud potřebují nějaký kontejner, vytvoří si instanci příslušné šablony s takovým typem, kterého jsou vkládané hodnoty. Pro takovou práci dříve javovské kolekce neposkytovaly žádnou podporu, do kontejneru bylo možné vkládat prakticky cokoliv a pokud někdo vyžadoval typovou bezpečnost, musel si vše ošetřit sám. Nová verze Javy ale přináší podstatnou změnu.
Nyní lze vytvořit typově určený kontejner, čímž máme zaručeno, že prvky v něm obsažené budou konkrétního typu. Pokus o porušení typové kontroly bude ohlášen již během kompilace. Podmínkou ale je, aby byl kontejner nejen vytvořen jako typový (tj. při volání konstruktoru), ale musí tak být deklarována příslušná proměnná. Kolekce bez typové kontroly lze nadále používat, kompilátor však bude vypisovat varování.
// starý způsob - chceme pracovat jen s celými čísly List list = new ArrayList(); // seznam bez určení typu list.add(new Integer(5)); // vložíme číslo... list.add(""); // ...ale klidně i něco jiného // nový způsob List<Integer> list = new ArrayList<Integer>(); // seznam celých čísel list.add(new Integer(5)); // vložíme číslo... list.add(""); // ...a tohle by kompilátor nedovolil
Uvedený způsob typové kontroly má jednu nevýhodu - je statický, takže
lze použít jen tam, kde typ známe předem. V řadě případů je tomu však jinak,
proto musíme použít dynamickou typovou kontrolu. Máme k dispozici wrappery
na generování typově bezpečných kolekcí, které se používají podobně jako jiné
wrappery (viz minulý díl). Při pokusu o porušení ochrany je vyvolána výjimka
ClassCastException
.
// vytváření seznamu - použijeme wrapper List<Integer> list = Collections.checkedList(new ArrayList<Integer>(), Integer.class); ForeignObj obj = new ForeignObj(); obj.setList(list) // nyní se seznam někam předá... // ...a tam to může vypadat třeba takto: public class ForeignObj { ... public void setList(List lst) { lst.add(new Integer(5)); // tohle je v pořádku lst.add("abc"); // tohle v pořádku není a způsobí to ClassCastException } }
Komplikací při práci s primitivními typy (int
, byte
apod.) byla nutnost
vytvářet zapouzdřující objekty při vkládání do kolekce. To už nyní není
nutné. Objekty se sice stále vytváření, ale programátor může jako argumenty
používat přímo příslušné primitivní typy (kontroverzní, nečisté řešení - ale
ulehčuje práci). Typové kontejnery je ovšem nutné deklarovat s uvedením
zapouzdřující třídy.
List<Double> list = new ArrayList<Double>(); // seznam celých čísel list.add(new Double(2.75)); // starý způsob list.add(2.75); // nový způsob
Při sekvenčním přístupu k prvkům přes iterátor jsme museli napsat poměrně
hodně kódu, který se při každém takovém použití opakoval. Proto vznikla
(opět podle mého názoru nepříliš čistá) berlička, spočívající v "rozšířeném"
(resp. speciálním) cyklu for
. Tento speciální cyklus řeší syntakticky to,
co se dosud provádělo ručně. Posuďte sami:
List<String> list = new ArrayList<String>(); // původní způsob (klasický cyklus) for (Iterator<String> i = list.iterator(); i.hasNext(); ) { System.out.println(i.next()); } // nový způsob (rozšířený cyklus for) for (String s : list) { System.out.println(s); }
Často používanými strukturami jsou fronty, proto se dostaly i do CF. Máme
zde nová rozhraní - Queue
(obecná fronta, rozšíření rozhraní Collection
o operace typické pro frontu) a BlockingQueue
(potomek Queue
, přidává
blokující operace). BlockingQueue
(a její implementace, viz dále) je součástí
balíku java.util.concurrent
, o kterém bude řeč někdy později - na tuto dobu
bych také přenechal další detaily ohledně front, bude to (z hlediska
souvislostí) vhodnější. Nyní tedy jen řeknu, že jednou z implementací front
je i spojový seznam - LinkedList
.
V řadě případů kolekci někdy na počátku vytvoříme a pak už se nemění buď
vůbec, nebo jen zřídka. Pro takové situace se hodí implementace, která
zajišťuje maximální rychlost při operacích čtení, bez ohledu na rychlost
manipulačních operací. V Javě 5.0 tuto skupinu reprezentují třídy
CopyOnWriteArrayList
a CopyOnWriteArraySet
(obě z balíku java.util.concurrent
).
Při přístupu k prvkům pracují velmi rychle, modifikace způsobí zkopírování
celého kontejneru (je to podobné jako u tzv. konstantních databází), což je
sice pomalé, ale tady to nevadí. Výhodou je, že se vůbec nemusíme starat
o synchronizaci, problémy se současným přístupem nejsou.
Ve třídě Collections
přibylo několik statických metod, poskytujících
poměrně příjemné funkce:
frequency()
- zjistí četnost výskytu určitého prvku v kolekci
disjoint()
- zjistí, zda jsou dané kolekce disjunktní (nemají společné prvky)
addAll()
- přidá do kolekce všechny prvky pole
reverseOrder()
- vytvoří komparátor, který funguje přesně obráceně (zajišťuje
obrácené uspořádání) než ten původní
Možná toho bylo o kolekcích až příliš, ale doufám, že to nevadí. Příště se vrátíme až na úplný začátek a povíme si zase něco o psaní programů, kompilaci, spouštění apod. Od doby, kdy seriál začal (tj. od loňského léta) se totiž leccos změnilo, současně tím ale budu reagovat i na reakce čtenářů, že by rádi do těchto věcí pronikli hlouběji