abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 16:22 | IT novinky

    Internetový prohlížeč Ladybird ohlásil tranzici z programovacího jazyka C++ do Rustu. Přechod bude probíhat postupně a nové komponenty budou dočasně koexistovat se stávajícím C++ kódem. Pro urychlení práce bude použita umělá inteligence, při portování první komponenty prohlížeče, JavaScriptového enginu LibJS, bylo během dvou týdnů pomocí nástrojů Claude Code a Codex vygenerováno kolem 25 000 řádků kódu. Nejedná se o čistě autonomní vývoj pomocí agentů.

    NUKE GAZA! 🎆 | Komentářů: 4
    včera 15:55 | Nová verze

    Byl vydán Mozilla Firefox 148.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově lze snadno povolit nebo zakázat jednotlivé AI funkce. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 148 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 2
    včera 12:44 | Nová verze

    Byla vydána nová verze 22.1.0, tj. první stabilní verze z nové řady 22.1.x, překladačové infrastruktury LLVM (Wikipedie). Přehled novinek v poznámkách k vydání: LLVM, Clang, LLD, Extra Clang Tools a Libc++.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Humor

    X86CSS je experimentální webový emulátor instrukční sady x86 napsaný výhradně v CSS, tedy bez JavaScriptu nebo dalších dynamických prvků. Stránka 'spouští' assemblerovový program mikroprocesoru 8086 a názorně tak demonstruje, že i prosté CSS může fungovat jako Turingovsky kompletní jazyk. Zdrojový kód projektu je na GitHubu.

    NUKE GAZA! 🎆 | Komentářů: 6
    včera 12:11 | Nová verze

    Po šesti letech byla vydána nová verze 1.3 webového rozhraní ke gitovým repozitářům CGit.

    Ladislav Hagara | Komentářů: 0
    včera 02:33 | Nová verze

    Byla vydána nová verze 6.1 linuxové distribuce Lakka (Wikipedie), jež umožňuje transformovat podporované počítače v herní konzole. Nejnovější Lakka přichází s RetroArchem 1.22.2.

    Ladislav Hagara | Komentářů: 0
    včera 02:11 | Nová verze

    Matematický software GNU Octave byl vydán ve verzi 11.1.0. Podrobnosti v poznámkách k vydání. Vedle menších změn rozhraní jsou jako obvykle zahrnuta také výkonnostní vylepšení a zlepšení kompatibility s Matlabem.

    |🇵🇸 | Komentářů: 1
    23.2. 21:44 | Nová verze

    Weston, referenční implementace kompozitoru pro Wayland, byl vydán ve verzi 15.0.0. Přehled novinek v příspěvku na blogu společnosti Collabora. Vypíchnout lze Lua shell umožňující psát správu oken v jazyce Lua.

    Ladislav Hagara | Komentářů: 0
    23.2. 21:11 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 29 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 4
    23.2. 18:22 | IT novinky

    Ústavní soud na svých webových stránkách i v databázi NALUS (NÁLezy a USnesení Ústavního soudu) představil novou verzi chatbota využívajícího umělou inteligenci. Jeho posláním je usnadnit veřejnosti orientaci v rozsáhlé judikatuře Ústavního soudu a pomoci jí s vyhledáváním informací i na webových stránkách soudu, a to i v jiných jazycích. Jde o první nasazení umělé inteligence v rámci webových stránek a databází judikatury českých soudů.

    Ladislav Hagara | Komentářů: 18
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (1%)
     (12%)
     (26%)
    Celkem 953 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: PERL - Získání dat mezi danými TAGY z PHP souboru

    28.9.2009 16:51 saky | skóre: 1
    PERL - Získání dat mezi danými TAGY z PHP souboru
    Přečteno: 618×

     Dobrý den. 

    Potřeboval bych dostat z php stránky informace obsažené mezi danými TAGy. 

    Mám nyní tento kód: 

    my $url = 'http://www.example.com/data.php'; 

    use LWP::Simple; 

    my $content = get $url; 

    my @slovo = split(" ", $content); 

    print "Celý soubor obsahuje: $content \n"; 

     

     

    Jde však o poměrně dlouhou stránku a text který chci získat do proměnné $obsah je uzavřen uprostřed stránky, 

    mezi < div id="dulezity_text">...Potřebný text...< /div>. 

    Lze nějak získat vše mezi těmito tagy?

     

    Moc děkuji všem :o)

     

     

     

     


    Řešení dotazu:


    Odpovědi

    28.9.2009 17:24 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    A nějaký dobře mířený regulární výraz by nestačil? Něco jako
    if $content =~ /<div\s+id="dulezity_text"\s+>(.*)<\/div>/ {
        my $text = $1;
    } else {
        # není tam
    }
    Ale jestli v tom divu může být další div, tak bude možná lepší nějaký parser pro HTML než tvořit složité výrazy.
    I am always ready to learn although I do not always like to be taught. (W. Churchill)
    28.9.2009 17:49 saky | skóre: 1
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

     Děkuji moc, to je přesně to co jsem hledal, avšak bohužel mi to stejně nefunguje..

    Mám to ještě zabaleno a posláno na příkaz stránka.. Možná mám chybu ve formátu. V kódu mám nyní toto:

     

     

          if ($arg =~ /!stranka/i) {

        my $url = 'http://www.example.com/data.php';

          use LWP::Simple;

        my $content = get $url;

        my @slovo = split(" ", $content);

       if $content =~ /<div\s+id="predpoved_nej_text"\s+>(.*)<\/div>/ {

        my $text = $1;

        print "Soubor obsahuje: $text \n";

         } else {

        print "Soubor neobsahuje žádné informace \n";   

        }  

         } 

     

    Nevíte, kde je chyba? .-)

    Řešení 1× (saky (tazatel))
    28.9.2009 18:34 pht | skóre: 48 | blog: pht
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    /<div\s+id="dulezity_text"\s*>(.*?)<\/div>/
    In Ada the typical infinite loop would normally be terminated by detonation.
    28.9.2009 18:35 pht | skóre: 48 | blog: pht
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Jo, a obvykle je dobré za to dát /xms nebo aspoň /ms, protože spoléhat se na konce řádků v HTML není dobré :)
    In Ada the typical infinite loop would normally be terminated by detonation.
    28.9.2009 20:39 saky | skóre: 1
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

     Bohužel ani tak to nejede... Aplikace ihned spadne i po nahrazení regulérních výrazů dle Vás..

    29.9.2009 07:27 pht | skóre: 48 | blog: pht
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Možná by bylo dobrý nějak popsat jaký text dostanete a co přesně z něho chcete dostat a co to znamená že spadne... takhle je to střílení do hnoje naslepo...
    In Ada the typical infinite loop would normally be terminated by detonation.
    Řešení 1× (saky (tazatel))
    29.9.2009 14:39 NeoV | skóre: 23
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

     S poslednymi upravami je regex urcite spravny a plne funkcny... mozno by som este upravil moznost vyskytu oboch typov uvodzoviek:

        $content =~ /<div\s+id=["']dulezity_text["']\s*>(.*?)<\/div>/ms

     

    btw. ste si isty, ze div element neobsahuje ine atributy ??? Pretoze ak ano (napr. style alebo class,...) tak potom je treba pouzit regex v style:

        $content =~ /<div[^>]+?id=["']dulezity_text["'][^>]*>(.*?)<\/div>/ms

     

    Vysledok je potom ulozeny do $1 build-in premennej Perlu...

    29.9.2009 14:48 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Pak tam taky může být atribut id, lang, base, title a kdo ví co ještě. Jak říkám, hrabat se v (X)HTML pomocí řádkové orientovaného editoru je hloupost.
    29.9.2009 15:08 pht | skóre: 48 | blog: pht
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Jenže tohle není řádkově orientovaný editor. Extrakce drobných pasáží z HTML pomocí regexpů v Perlu je podstatně jednodušší a rychlejší, než stavět parser na potažmo špatný vstup, protože co si budeme nalhávat, dobrá půlka stránek validátorem nejprojde.
    In Ada the typical infinite loop would normally be terminated by detonation.
    29.9.2009 16:08 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Právě že HTML::Parser stráví i špatný kód. Jasně, pokud programátor ví, jaký bude vstup, tak regulární výraz je odpovídající nástroj. Pokud ale chcete pokrýt volnost HTML (kam volitelné atributy podle mě patří), tak je lepší použít Parser.
    29.9.2009 16:32 pht | skóre: 48 | blog: pht
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Volitelné atributy vyřídíte pomocí .*? nebo něčeho takového; s regexpama můžete dosáhnout dost velké adaptivity proti efektu autorově rupnutí v kouli, případně extrahovat jednoduše několik nesouvisejících věcí do pole, atp.

    Písmenko "e" v Perl je od "extract", a operátor =~ by se neměl podceňovat.
    In Ada the typical infinite loop would normally be terminated by detonation.
    Řešení 1× (saky (tazatel))
    30.9.2009 14:53 ams
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

    Chybi Vam zavorky kolem podminky v 'if'. Musi byt

    if ( $content =~ /tady je ten regexp/ ) {

    } else {

    }

    30.9.2009 15:26 NeoV | skóre: 23
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

     hehe dobry postreh.. ale ved na toto mu predsa musel priamo poukazal kompilator hlaskou v style:

    syntax error at FILE line N , near "if $content"

    , alebo nieco podobne :-)

    29.9.2009 11:59 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
    Doporučuji použít HTML::Parser. Ušetříte si spoustu nervů se špatně utvořeným HTML.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.