Zajímavě hloupý konečný automat (link) |
3.11.2005 10:57
Hynek (Pichi) Vychodil
|
Věk: ( ~49 let)
, Pracovní pozice: software architect
, Praxe v IT let: ( ~15 let)
, Bydliště: Brno |
Řetězec "Perl" je totiž v 1. případě hledán pouze jednou.
Tahle věta mě hodně zarazila. Říkal jsem si, že ta implementace regulárních výrazů nemůže být tak hloupá, aby to v tom druhém případě dělalo fakt dvakrát. Jistě tomu tak není, ale skutečně je v tom nějaký zádrhel a konečný automat vygenerovaný v druhém případě opravdu je složiťejší a pomalejší než v prvním případě. Na delších řeťězcích roste délka prohledávání na deseti a více násobky. Viz jednoduchý test:#!/usr/bin/env perl
use strict;
use warnings;
use Benchmark qw(:all :hireswallclock); my $r = 100; # string parts repeat
my $i = 1000; # grep repeats
my $l = -2; # test for 2 seconds my $str = 'euiwghiweuh'x$r . 'Perl5' . 'wehjdiuh'x$r . 'Perl6' . 'weiuhiwhjh'x$r; # make string my %regexps = ( # tested regexps
first => qr/Perl(5|6)/o,
second => qr/Perl5|Perl6/o,
first_nomatch => qr/Perl(?:5|6)/o,
); sub makeRegexpTests (\%) { # make hash of tests from regexps
map { # make pairs 'regexp_name' => sub { regexp testing }
my $re = $regexps{$_}; # store regexp in local variable
$_, # regexp name ( return ('regexp_name', testing function) )
sub { # testing function
for (my $c = 0; $c < $i; $c++) {
$str =~ m/$re/g; # here can't use $regexps{$_} because value wasn't finded in compile time
};
}
} keys %{$_[0]}
} cmpthese(
$l, # how long/repeats tests
{ makeRegexpTests %regexps }, # tests
);
P.S.: Mimochodem, proč se uvnitř tagu <pre> strácejí prázdné řádky? BTW proč se mi při opakované editaci objeví < převedené na <? |
|
|
Re: Zajímavě hloupý konečný automat (link) |
3.11.2005 13:45
Hynek (Pichi) Vychodil
|
Věk: ( ~49 let)
, Pracovní pozice: software architect
, Praxe v IT let: ( ~15 let)
, Bydliště: Brno |
Tady je verze pro zkoumani vlivu délky řetězce. Omlouvám se za trošku cryptic způsob zápisu, ale mě to přijde krásně čitelné a už snad ani jinak psát neumím :-)
#!/usr/bin/env perl
use strict;
use warnings;
use Benchmark qw(:all :hireswallclock); my $l = -2; # test for 2 seconds
my @testParams = (
{r=>1, i=>100000}, # r=>string parts repeats, i=>grep repeats
{r=>10, i=>10000},
{r=>100, i=>1000},
);
my %regexps = ( # tested regexps
first => qr/Perl(5|6)/,
second => qr/Perl5|Perl6/,
first_nomatch => qr/Perl(?:5|6)/,
);
sub testString ($) { # make testing string
my ($r) = @_;
'euiwghiweuh'x$r . 'Perl5' . 'wehjdiuh'x$r . 'Perl6' . 'weiuhiwhjh'x$r
} sub makeRegexpTest ($$$) { # make test function
my ($str, $re, $i) = @_; # localize parameters for use in testing function
sub { # testing function (here $str, $re, $i like constants - see perlsub(1))
for (my $c = 0; $c < $i; $c++) {
$str =~ m/$re/g;
};
}
} foreach ( @testParams ) {
my ($r, $i) = @$_{qw(r i)};
print "r: $r, i: $i$/";
cmpthese(
$l, # how long/repeats tests
{ map +($_, makeRegexpTest testString $r, $regexps{$_}, $i), keys %regexps }, # tests
);
} |
|
|
|
Příspívat do diskuze mohou pouze registrovaní uživatelé.
|
|
Vyhledávání software
Vyhledávání článků
28.11.2018 23:56 /František Kučera Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1
12.11.2018 21:28 /Redakce Linuxsoft.cz 22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář
6.11.2018 2:04 /František Kučera Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
4.10.2018 21:30 /Ondřej Čečák LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář
18.9.2018 23:30 /František Kučera Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
9.9.2018 14:15 /Redakce Linuxsoft.cz 20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business.
Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář
12.8.2018 16:58 /František Kučera Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář
16.7.2018 1:05 /František Kučera Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář
Více ...
Přidat zprávičku
Poslední diskuze
31.7.2023 14:13 /
Linda Graham iPhone Services
30.11.2022 9:32 /
Kyle McDermott Hosting download unavailable
13.12.2018 10:57 /
Jan Mareš Re: zavináč
2.12.2018 23:56 /
František Kučera Sraz
5.10.2018 17:12 /
Jakub Kuljovsky Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?
Více ...
|