abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 16:00 | Nová verze

Byl vydán Mozilla Firefox 51.0. Z novinek lze upozornit například na upozorňování na přihlašování přes nešifrované spojení (HTTP), podporu pro přehrávání bezeztrátového formátu FLAC nebo podporu WebGL 2. Podrobné informace v poznámkách k vydání a na stránce věnované vývojářům. Řešeny jsou také bezpečnostní chyby.

Ladislav Hagara | Komentářů: 0
včera 17:25 | IT novinky

Do prodeje (Farnell) se dostal jednodeskový počítač Tinker Board (unboxing). Jedná se o konkurenci Raspberry Pi 3 od společnosti Asus. Porovnání (jpg) těchto počítačů například na CNXSoft. Cena Tinker Boardu je 55 £.

Ladislav Hagara | Komentářů: 13
včera 14:44 | Zajímavý projekt

Byla zveřejněna pravidla hackerské soutěže Pwn2Own 2017, jež proběhne od 15. do 17. března v rámci bezpečnostní konference CanSecWes ve Vancouveru. Soutěžit se bude o více než milion dolarů v pěti kategoriích. Letos se bude útočit i na Ubuntu. Jedná se již o 10. ročník této soutěže.

Ladislav Hagara | Komentářů: 2
včera 13:33 | Nová verze

Po sedmi měsících vývoje od vydání verze 5.7 byla vydána verze 5.8 (YouTube) toolkitu Qt. Z novinek lze zmínit například Qt Lite pro vestavěná zařízení. Nově jsou plně podporovány moduly Qt Wayland Compositor (YouTube) a Qt SCXML (YouTube). Současně byla vydána verze 4.2.1 integrovaného vývojového prostředí (IDE) Qt Creator.

Ladislav Hagara | Komentářů: 1
včera 11:52 | Pozvánky

Lednový Prague Containers Meetup se koná ve čtvrtek 26. ledna 2017 od 18:00 v Apiary, Pernerova 49, Praha 8. Přijďte se podívat na přednášky o Enterprise Kubernetes a Jenkins as a code.

little-drunk-jesus | Komentářů: 0
včera 11:40 | Pozvánky

Program letošního ročníku konference Prague PostgreSQL Developer Days, která se koná již 15. a 16. února 2017 na ČVUT FIT, Thákurova 9, Praha 6, byl dnes zveřejněn. Najdete ho na stránkách konference včetně anotací přednášek a školení. Registrace na konferenci bude otevřena zítra (24. ledna) v brzkých odpoledních hodinách.

TomasVondra | Komentářů: 0
22.1. 02:20 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu, upozorňuje na svém blogu, že nový Inkscape 0.92 rozbíjí dokumenty vytvořené v předchozích verzích Inkscape. Problém by měl být vyřešen v Inkscape 0.92.2 [reddit].

Ladislav Hagara | Komentářů: 0
22.1. 02:02 | Komunita

Øyvind Kolås, hlavní vývojář grafických knihoven GEGL a babl, které využívá grafický program GIMP, žádá o podporu na Patreonu. Díky ní bude moci pracovat na vývoji na plný úvazek. Milník 1000 $, který by stačil na holé přežití, se již téměř podařilo vybrat, dalším cílem je dosažení 2500 $, které mu umožní běžně fungovat ve společnosti.

xkomczax | Komentářů: 12
21.1. 23:54 | Pozvánky

DevConf.cz 2017, již devátý ročník jedné z největších akcí zaměřených na Linux a open source ve střední Evropě, proběhne od pátku 27. ledna do neděle 29. ledna v prostorách Fakulty informačních technologií Vysokého učení technického v Brně. Na programu je celá řada zajímavých přednášek a workshopů. Letos je povinná registrace.

Ladislav Hagara | Komentářů: 0
21.1. 22:11 | Nová verze

Byla vydána verze 1.0.0 emulátoru terminálu Terminology postaveného nad EFL (Enlightenment Foundation Libraries). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (12%)
 (2%)
 (72%)
 (3%)
 (11%)
Celkem 394 hlasů
 Komentářů: 38, poslední dnes 17:00
Rozcestník
Reklama

Dotaz: PERL - Získání dat mezi danými TAGY z PHP souboru

28.9.2009 16:51 saky | skóre: 1
PERL - Získání dat mezi danými TAGY z PHP souboru
Přečteno: 508×

 Dobrý den. 

Potřeboval bych dostat z php stránky informace obsažené mezi danými TAGy. 

Mám nyní tento kód: 

my $url = 'http://www.example.com/data.php'; 

use LWP::Simple; 

my $content = get $url; 

my @slovo = split(" ", $content); 

print "Celý soubor obsahuje: $content \n"; 

 

 

Jde však o poměrně dlouhou stránku a text který chci získat do proměnné $obsah je uzavřen uprostřed stránky, 

mezi < div id="dulezity_text">...Potřebný text...< /div>. 

Lze nějak získat vše mezi těmito tagy?

 

Moc děkuji všem :o)

 

 

 

 


Řešení dotazu:


Odpovědi

28.9.2009 17:24 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
A nějaký dobře mířený regulární výraz by nestačil? Něco jako
if $content =~ /<div\s+id="dulezity_text"\s+>(.*)<\/div>/ {
    my $text = $1;
} else {
    # není tam
}
Ale jestli v tom divu může být další div, tak bude možná lepší nějaký parser pro HTML než tvořit složité výrazy.
I am always ready to learn although I do not always like to be taught. (W. Churchill)
28.9.2009 17:49 saky | skóre: 1
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

 Děkuji moc, to je přesně to co jsem hledal, avšak bohužel mi to stejně nefunguje..

Mám to ještě zabaleno a posláno na příkaz stránka.. Možná mám chybu ve formátu. V kódu mám nyní toto:

 

 

      if ($arg =~ /!stranka/i) {

    my $url = 'http://www.example.com/data.php';

      use LWP::Simple;

    my $content = get $url;

    my @slovo = split(" ", $content);

   if $content =~ /<div\s+id="predpoved_nej_text"\s+>(.*)<\/div>/ {

    my $text = $1;

    print "Soubor obsahuje: $text \n";

     } else {

    print "Soubor neobsahuje žádné informace \n";   

    }  

     } 

 

Nevíte, kde je chyba? .-)

Řešení 1× (saky (tazatel))
28.9.2009 18:34 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
/<div\s+id="dulezity_text"\s*>(.*?)<\/div>/
In Ada the typical infinite loop would normally be terminated by detonation.
28.9.2009 18:35 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Jo, a obvykle je dobré za to dát /xms nebo aspoň /ms, protože spoléhat se na konce řádků v HTML není dobré :)
In Ada the typical infinite loop would normally be terminated by detonation.
28.9.2009 20:39 saky | skóre: 1
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

 Bohužel ani tak to nejede... Aplikace ihned spadne i po nahrazení regulérních výrazů dle Vás..

29.9.2009 07:27 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Možná by bylo dobrý nějak popsat jaký text dostanete a co přesně z něho chcete dostat a co to znamená že spadne... takhle je to střílení do hnoje naslepo...
In Ada the typical infinite loop would normally be terminated by detonation.
Řešení 1× (saky (tazatel))
29.9.2009 14:39 NeoV | skóre: 23
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

 S poslednymi upravami je regex urcite spravny a plne funkcny... mozno by som este upravil moznost vyskytu oboch typov uvodzoviek:

    $content =~ /<div\s+id=["']dulezity_text["']\s*>(.*?)<\/div>/ms

 

btw. ste si isty, ze div element neobsahuje ine atributy ??? Pretoze ak ano (napr. style alebo class,...) tak potom je treba pouzit regex v style:

    $content =~ /<div[^>]+?id=["']dulezity_text["'][^>]*>(.*?)<\/div>/ms

 

Vysledok je potom ulozeny do $1 build-in premennej Perlu...

29.9.2009 14:48 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Pak tam taky může být atribut id, lang, base, title a kdo ví co ještě. Jak říkám, hrabat se v (X)HTML pomocí řádkové orientovaného editoru je hloupost.
29.9.2009 15:08 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Jenže tohle není řádkově orientovaný editor. Extrakce drobných pasáží z HTML pomocí regexpů v Perlu je podstatně jednodušší a rychlejší, než stavět parser na potažmo špatný vstup, protože co si budeme nalhávat, dobrá půlka stránek validátorem nejprojde.
In Ada the typical infinite loop would normally be terminated by detonation.
29.9.2009 16:08 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Právě že HTML::Parser stráví i špatný kód. Jasně, pokud programátor ví, jaký bude vstup, tak regulární výraz je odpovídající nástroj. Pokud ale chcete pokrýt volnost HTML (kam volitelné atributy podle mě patří), tak je lepší použít Parser.
29.9.2009 16:32 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Volitelné atributy vyřídíte pomocí .*? nebo něčeho takového; s regexpama můžete dosáhnout dost velké adaptivity proti efektu autorově rupnutí v kouli, případně extrahovat jednoduše několik nesouvisejících věcí do pole, atp.

Písmenko "e" v Perl je od "extract", a operátor =~ by se neměl podceňovat.
In Ada the typical infinite loop would normally be terminated by detonation.
Řešení 1× (saky (tazatel))
30.9.2009 14:53 ams
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

Chybi Vam zavorky kolem podminky v 'if'. Musi byt

if ( $content =~ /tady je ten regexp/ ) {

} else {

}

30.9.2009 15:26 NeoV | skóre: 23
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru

 hehe dobry postreh.. ale ved na toto mu predsa musel priamo poukazal kompilator hlaskou v style:

syntax error at FILE line N , near "if $content"

, alebo nieco podobne :-)

29.9.2009 11:59 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: PERL - Získání dat mezi danými TAGY z PHP souboru
Doporučuji použít HTML::Parser. Ušetříte si spoustu nervů se špatně utvořeným HTML.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.