abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 12:33 | Komunita

Příspěvek na blogu Signalu (Wikipedie) informuje o založení neziskové nadace Signal Foundation, jež bude zastřešovat další vývoj tohoto svobodného bezpečného komunikátoru běžícího také na Linuxu (Signal Desktop). Brian Acton, spoluzakladatel WhatsAppu, věnoval nadaci 50 milionů dolarů [Hacker News].

Ladislav Hagara | Komentářů: 1
včera 05:55 | Zajímavý článek

Článek na Fedora Magazine krátce představuje programovací jazyk Rust a několik zajímavých v Rustu naprogramovaných terminálových aplikací. Jedná se o alternativu k příkazu grep ripgrep, moderní barevnou alternativu k příkazu ls exa, příkazem cloc inspirovaný tokei a zvířátko v terminálu ternimal.

Ladislav Hagara | Komentářů: 0
21.2. 23:55 | Zajímavý projekt

Byl spuštěn Humble Classics Return Bundle. Za vlastní cenu lze koupit hry Broken Sword 5 - The Serpent's Curse, Shadowrun Returns a Shadowrun: Dragonfall - Director's Cut. Při nadprůměrné platbě (aktuálně 8,48 $) také Shadowrun: Hong Kong - Extended Edition, Wasteland 2: Director's Cut - Standard Edition, Age of Wonders III a Xenonauts. Při platbě 15 $ a více lze získat navíc Torment: Tides of Numenera a Dreamfall Chapters: The Final Cut Edition.

Ladislav Hagara | Komentářů: 0
21.2. 00:11 | Bezpečnostní upozornění

Vývojáři linuxové distribuce Mageia na svém blogu upozorňují na narušení bezpečnosti Mageia Identity. Narušitel získal přístup k LDAP databázi a zveřejnil jména uživatelů, jejich emailové adresy a haše hesel. Hesla uživatelů byla resetována.

Ladislav Hagara | Komentářů: 3
20.2. 21:55 | Nová verze

Byla vydána verze 2.0.0 nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). Z novinek je nutno upozornit na nový zpětně nekompatibilní formát záznamu asciicast v2. S novým formátem si poradí nové verze asciinema-playeru a asciinema-serveru [Hacker News].

Ladislav Hagara | Komentářů: 0
20.2. 05:55 | Zajímavý projekt

Dle příspěvku na blogu zaměstnanců CZ.NIC byl spuštěn ostrý provoz služby Honeypot as a Service (HaaS). Zapojit se může kdokoli. Stačí se zaregistrovat a nainstalovat HaaS proxy, která začne příchozí komunikaci z portu 22 (běžně používaného pro SSH) přeposílat na server HaaS, kde honeypot Cowrie (GitHub) simuluje zařízení a zaznamenává provedené příkazy. Získat lze tak zajímavé informace o provedených útocích. K dispozici jsou globální statistiky.

Ladislav Hagara | Komentářů: 12
20.2. 04:44 | Komunita

Před týdnem společnost Feral Interactive zabývající se vydáváním počítačových her pro operační systémy macOS a Linux oznámila, že pro macOS a Linux vydají hru Rise of the Tomb Raider. Včera společnost oznámila (YouTube), že pro macOS a Linux vydají také hru Total War Saga: Thrones of Britannia. Verze pro Windows by měla vyjít 19. dubna. Verze pro macOS a Linux krátce na to.

Ladislav Hagara | Komentářů: 0
19.2. 21:33 | Nová verze

Byla vydána nová major verze 7.10 svobodného systému pro řízení vztahů se zákazníky (CRM) s názvem SuiteCRM (Wikipedie). Jedná se o fork systému SugarCRM (Wikipedie). Zdrojové kódy SuiteCRM jsou k dispozici na GitHubu pod licencí AGPL.

Ladislav Hagara | Komentářů: 0
19.2. 16:44 | Nová verze

Byla vydána nová verze 0.30 display serveru Mir (Wikipedie) a nová verze 2.31 nástrojů snapd pro práci s balíčky ve formátu snap (Wikipedie). Z novinek Miru vývojáři zdůrazňují vylepšenou podporu Waylandu nebo možnost sestavení a spouštění Miru ve Fedoře. Nová verze snapd umí Mir spouštět jako snap.

Ladislav Hagara | Komentářů: 0
19.2. 14:00 | Komunita

Na Indiegogo běží kampaň na podporu Sway Hackathonu, tj. pracovního setkání klíčových vývojářů s i3 kompatibilního dlaždicového (tiling) správce oken pro Wayland Sway. Cílová částka 1 500 dolarů byla vybrána již za 9 hodin. Nový cíl 2 000 dolarů byl dosažen záhy. Vývojáři přemýšlejí nad dalšími cíli.

Ladislav Hagara | Komentářů: 1
Který webový vyhledávač používáte nejčastěji?
 (2%)
 (28%)
 (61%)
 (3%)
 (3%)
 (0%)
 (1%)
 (1%)
Celkem 430 hlasů
 Komentářů: 35, poslední 21.2. 19:51
    Rozcestník

    Dotaz: multi regexp

    19.7.2013 14:43 Zaboj Campula
    multi regexp
    Přečteno: 314×

    Zdravim vsechny,

    Vstup

    • Mam mnozinu regularnich vyrazu (radove tisice).
    • a mam jeden textovy retezec.
    Problem
    • Najit alespon jeden regularni vyraz ktery s shoduje s retezcem nebo vratit chybu.
    Jazyk
    • idealne c/c++
    Sekvencni prochazeni vsech regularnich vyrazu a test na shodu je pomale.

    Ma nekdo nejaky napad na chytry algoritmus?

    Odpovědi

    19.7.2013 15:55 Kit
    Rozbalit Rozbalit vše Re: multi regexp
    Spojit těch 1000 regulárních výrazů do jednoho?
    19.7.2013 16:15 extremni lama | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: multi regexp
    pokud potrebuje vedet i ktery z nich matchuje tak to nebude tak jednoduchy.

    Napada me treba:

    - nejdriv udelas jeden velky RE, ktery vrati match pokud libovolny z tech 1000 RE by vratil match

    - vyzkousis a pokud najde match, tak:

    - vytvoris si 2 novy RE. Jeden bude spojovat puvodni RE 1 .. 500, ten druhy bude spojovat puvodni RE 501 .. 1000

    - vyzkousis match s kazdym z tech dvou

    - ten ktery vrati shodu znovu rozdelis, atd...

    Ty spojovaci RE by sis mohl predpocitat a umistnit do binarniho stromu, ktery bys potom prochazel od korene k listum...

    Takze bys vzdycky zkousel log2(N) RE.
    The enemy of my enemy is still my enemy.
    19.7.2013 16:20 extremni lama | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: multi regexp
    jeste bych doplnil ze tohle by melo fungovat dobre pokud pouzivas regex engine ktery si to vnitrne prevadi na FA.

    Pokud vnitrne pouziva backtracking tak to asi nepomuze...
    The enemy of my enemy is still my enemy.
    19.7.2013 16:18 Zaboj Campula
    Rozbalit Rozbalit vše Re: multi regexp
    To jako kdybych mel dejme tomu regularni vyrazy
    • A.*B
    • A[AB]C
    • D$
    Tak udlat jeden \(A.*B\|A[AB]C\|D$\) To by mozna slo, ale nejsem si jisty jestly by to bylo o moc rychlejsi nez sekvencni prohledavani. Zmerim a dam vedet.
    19.7.2013 16:58 Kit
    Rozbalit Rozbalit vše Re: multi regexp
    Přesně tak. Záleží na kvalitě kompilátoru regulárního výrazu, ale předpokládám řádové zrychlení oproti sekvenčnímu prohledávání.

    Některé jazyky (např. PHP) umožňují zadat regulární výrazy do pole. Netuším, jak je to s rychlostí.
    wamba avatar 19.7.2013 18:00 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: multi regexp
    No v Perl-u jsem to zkoušel a dokážu najít případy, kdy to bude rychlejší i o dost pomalejší
    #!/usr/bin/perl
    use 5.010;
    use warnings;
    use strict;
    use List::Util qw{first};
    use Benchmark;
    our $VERSION = 0.001;
    
    my $string =
    '234781802319q8019810328103982104398021483049823094830498023982094823028340932840923830483201223';
    
    my @multiregexp = ( qr{ \A \d+ . \z }msx, qr{ \$ }msx, );
    
    timethese(
        1000000,
        {
            more => sub {
                my $trueregexp = first { $string ~~ $_ } @multiregexp;
            },
            one => sub { my $tt = $string ~~ m{\A \d+ . \z|\$}msx ? 1 : 0; },
            one_better =>
              sub { my $tt = $string ~~ m{\A \d+ . \z|\A .* \$ .* \z}msx ? 1 : 0; },
        }
    );
    
    mi vypíše
    Benchmark: timing 1000000 iterations of more, one, one_better...
          more:  3 wallclock secs ( 2.72 usr +  0.00 sys =  2.72 CPU) @ 367647.06/s (n=1000000)
           one: 14 wallclock secs (13.69 usr +  0.01 sys = 13.70 CPU) @ 72992.70/s (n=1000000)
    one_better: 12 wallclock secs (12.06 usr +  0.00 sys = 12.06 CPU) @ 82918.74/s (n=1000000)
    
    když $string upravím a přidám na konec $, tak
          more:  3 wallclock secs ( 3.21 usr +  0.00 sys =  3.21 CPU) @ 311526.48/s (n=1000000)
           one: 12 wallclock secs (13.74 usr +  0.00 sys = 13.74 CPU) @ 72780.20/s (n=1000000)
    one_better:  1 wallclock secs ( 2.04 usr +  0.00 sys =  2.04 CPU) @ 490196.08/s (n=1000000)
    
    a když smažu q z takto upraveného $string
          more:  3 wallclock secs ( 2.18 usr +  0.00 sys =  2.18 CPU) @ 458715.60/s (n=1000000)
           one:  1 wallclock secs ( 1.39 usr +  0.00 sys =  1.39 CPU) @ 719424.46/s (n=1000000)
    one_better:  0 wallclock secs ( 1.36 usr +  0.00 sys =  1.36 CPU) @ 735294.12/s (n=1000000)
    
    atp.
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    wamba avatar 19.7.2013 18:51 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: multi regexp
    a to first ještě dá na výstup, který ten regexp bude true ještě se to dá otestovat jako
     more_better => sub {
                my $tt = $string ~~ @multiregexp ? 1 : 0;
              }
    
    které je nejrychlejší ve všech předešlých případech
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    19.7.2013 15:59 Mr.S1lent.cz
    Rozbalit Rozbalit vše Re: multi regexp
    Nebo taky muzes zaindexovat hledany retezec a napsat custom regexp nastroj pro vyhledavani v indexu :)
    19.7.2013 16:25 Zaboj Campula
    Rozbalit Rozbalit vše Re: multi regexp
    Omlovam se, ale nechapu. Slo by ten napad nejak rozvest, abych ho pochopil i ja?
    19.7.2013 18:55 Mr.S1lent.cz
    Rozbalit Rozbalit vše Re: multi regexp
    Zalezi na povaze vstupu, z toho musis vychazet.

    1) je to nahodny retezec vsech pismen nebo jen velkych a malych, cisel, specialnich znaku? 2) regexpy jsou generovany obecne na nejake mnoziny znaku nebo primo na nejaky konkretni retezce?

    To zaindexovani ti odhalim, az ty mi zodpovis tyto dva body, jinak to nema smysl :)
    wamba avatar 20.7.2013 09:59 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: multi regexp
    tak abych odpověděl navrhuji použít Perl
    use 5.010;
    use warnings;
    use strict;
    use List::Util qw{first};
    our $VERSION = 0.001;
    
    my $string =
    '23478180231x98019810328103982104398021483049823094830498023982094823028340932840923830483201223$';
    
    my @multiregexp = ( qr{ \A \d+ . \z }msx, qr{ \$ }msx, );
    my $trueregexp = first { $string ~~ $_ } @multiregexp;
    
    say 'tento regexp vyhovuje ', $trueregexp;
    
    a když to nebude dostatečně rychlé, tak to chce vědět více o těch regexp-ech popř. o tom řetězci, aby se dalo navrhnout něco efektivnějšího
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    23.7.2013 15:51 Zaboj Campula
    Rozbalit Rozbalit vše Re: multi regexp

    Takze dekuji vsem za kometare.

    Spojeni do jednoho velkeho regexpu jak je navrzeno vyse by snad splnilo podminku na rychle vyhledavani, nicmene jsem skoncil na tom ze je potreba i pomerne rychla reakce na to kdyz uzivatel nejaky regulani vyraz prida/ubere/zmeni a konstrukce toho dloooouheho regularniho vyrazu a jeho kompilace je prilis pomala.

    Vysledne reseni je nakonec zalozene na tom, ze ty regularni vyrazy - tedy alespon vetsinaz nich ma v sobe nejaky pevny retezec, napriklad "[0-9]ABC[0-9]" a pomoci techto retezcu lze udelat index a v tom indexu najit podmnozinu regexu ktere se pak matchuji sekvencne. Vetsinou jsou to regexy slozitejsi nez v tom prikladu, ale obvykle to jde a tech par stovek regexu, ze kterych se neda nejaky rozumny retezec vyextraovat se bude prochazet sekvencne az kdyz se nenajde jinde.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.