abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Google Chrome 149 byl prohlášen za stabilní. Nejnovější stabilní verze 149.0.7827.53 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 10:55 | Nová verze

    Pluto.jl, reaktivní notebook pro programovací jazyk Julia, dospěl do verze 1.0.

    Ladislav Hagara | Komentářů: 3
    2.6. 13:44 | Nová verze

    Byla vydána nová verze 12.0.0 vizuálního programovacího jazyka Snap! (Wikipedie) inspirovaného jazykem Scratch (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:44 | IT novinky

    Počítačovou hru Gravity Circuit (ProtonDB) lze do 14. června do 19:00 získat na Steamu zdarma. Napořád.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:00 | Bezpečnostní upozornění

    Nejnovější X.Org X server 21.1.23 a Xwayland 24.1.12 řeší 9 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    1.6. 22:33 | Bezpečnostní upozornění

    npm balíčky @redhat-cloud-services byly kompromitovány.

    Ladislav Hagara | Komentářů: 5
    1.6. 22:22 | Bezpečnostní upozornění

    Byly publikovány informace o zranitelnosti CVE-2026-46243 pojmenované CIFSwitch v Linuxu od roku 2007. Běžný uživatel může získat práva roota (lokální eskalaci práv). V upstreamu je již opraveno.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1809 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: Ako v perli vytiahnut data z html?

    16.8.2006 10:00 ajikdpoe | skóre: 23 | blog: dvh
    Ako v perli vytiahnut data z html?
    Přečteno: 116×
    Ahoj.

    Chcem spravit program ktory ma bude upozornovat na novu postu na www.post.sk (Normalna notifikacia je tam platena). Tu je screenshot kde je zvyraznene cislo 1 ktore znamena ze mam 1 novu neprecitanu postu. Je to normalne html ktore viem stiahnut napr. pomocou wgetu (prihlasenie a stiahnutie tej stranky mam uz vyriesene). Ide mi o extrahovanie tej "1" z toho html.

    Na zaklade nazvu perlu "Practical Extraction and Report language" som usudil ze toto je ten pravy nastroj na tuto vec. Nejake zaklady mam ale su to maximalne tak nastavenie premennej , hello word, a podobne...

    Neviete ma niekto nasmerovat na nejaku dokumentaciu alebo nieco podobne kde by som sa naucil ako perlom extrahovat data z html alebo mozno skuste nacrtnut riesenie. Vdaka.

    Tu stiahnutu html najdete tu (bez css a obrazkov) a v okoli tej jednotky sa nachadza tento html kod (medzery a EOL som odstranil lebo by to bolo neprehladne ale nejake tam su):
    .
    .
    .
    <!-- menu - margin - obsah -->
    <td style="padding-left: 15px; padding-top: 10px; background-color: #FFF5B6;">
    <table id="menu-obsah" style="widht: 133px;" cellspacing="0" cellpadding="0" border="0">
    <colgroup style="width: 33px; text-align: left" />
    <colgroup style="width: 100px; text-align: left" />
    <tr>
    <td><img src="http://obr.post.sk/obrazky/menu-nova.gif" alt="" /></td>
    <td><h2><a href="?s=new_msg">Nová správa</a></h2></td>
    </tr>
    <tr>
    <td><img src="http://obr.post.sk/obrazky/menu-adresar.gif" alt="" /></td>
    <td><h2><a href="?s=adresar">Adresár</a></h2></td>
    </tr>
    <tr>
    <td><img src="http://obr.post.sk/obrazky/menu-dorucene.gif" alt="" /></td>
    <td><h2><a href="?s=main&f=135432"><b>Doručené</b></a> (<b>1</b>/21)</h2></td>
    </tr>
    
    <!-- vlastne adresare -->
    .
    .
    .
    
    dvh

    Odpovědi

    16.8.2006 10:35 zabza | skóre: 52 | blog: Nad_sklenkou_cerveneho
    Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
    http://search.cpan.org/~gaas/HTML-Parser-3.55/Parser.pm

    ... anebo to můžete dělat "prasácky" pomocí regulárních výrazů...
    16.8.2006 11:07 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
    dalsi vhodny package: HTML::TreeBuilder
    (i ked v tomto pripade by mozno bolo jednoduchsie pouzit ten regularny vyraz :-) )
    16.8.2006 10:51 klobouk | skóre: 2
    Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
    Nevim jak na to v Perlu, ale moc se tesim na reseni od Jana Martinka :-) Myslim, ze by sva roztomila kratka pythonovska dilka mel probrat a v nejake ucelenejsi forme je nekde vystavit jako FAQ nebo tak neco. Myslim, ze na inspiraci pro reseni jinych problemu by to byl vynikajici zdroj pro lidi, kteri by chteli zacit Python vyuzivat v beznem zivote :-)
    Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.