Portál AbcLinuxu, 11. května 2025 00:24

Dotaz: Ako v perli vytiahnut data z html?

16.8.2006 10:00 ajikdpoe | skóre: 23 | blog: dvh
Ako v perli vytiahnut data z html?
Přečteno: 58×
Odpovědět | Admin
Ahoj.

Chcem spravit program ktory ma bude upozornovat na novu postu na www.post.sk (Normalna notifikacia je tam platena). Tu je screenshot kde je zvyraznene cislo 1 ktore znamena ze mam 1 novu neprecitanu postu. Je to normalne html ktore viem stiahnut napr. pomocou wgetu (prihlasenie a stiahnutie tej stranky mam uz vyriesene). Ide mi o extrahovanie tej "1" z toho html.

Na zaklade nazvu perlu "Practical Extraction and Report language" som usudil ze toto je ten pravy nastroj na tuto vec. Nejake zaklady mam ale su to maximalne tak nastavenie premennej , hello word, a podobne...

Neviete ma niekto nasmerovat na nejaku dokumentaciu alebo nieco podobne kde by som sa naucil ako perlom extrahovat data z html alebo mozno skuste nacrtnut riesenie. Vdaka.

Tu stiahnutu html najdete tu (bez css a obrazkov) a v okoli tej jednotky sa nachadza tento html kod (medzery a EOL som odstranil lebo by to bolo neprehladne ale nejake tam su):
.
.
.
<!-- menu - margin - obsah -->
<td style="padding-left: 15px; padding-top: 10px; background-color: #FFF5B6;">
<table id="menu-obsah" style="widht: 133px;" cellspacing="0" cellpadding="0" border="0">
<colgroup style="width: 33px; text-align: left" />
<colgroup style="width: 100px; text-align: left" />
<tr>
<td><img src="http://obr.post.sk/obrazky/menu-nova.gif" alt="" /></td>
<td><h2><a href="?s=new_msg">Nová správa</a></h2></td>
</tr>
<tr>
<td><img src="http://obr.post.sk/obrazky/menu-adresar.gif" alt="" /></td>
<td><h2><a href="?s=adresar">Adresár</a></h2></td>
</tr>
<tr>
<td><img src="http://obr.post.sk/obrazky/menu-dorucene.gif" alt="" /></td>
<td><h2><a href="?s=main&f=135432"><b>Doručené</b></a> (<b>1</b>/21)</h2></td>
</tr>

<!-- vlastne adresare -->
.
.
.
dvh
Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

16.8.2006 10:35 zabza | skóre: 52 | blog: Nad_sklenkou_cerveneho
Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
Odpovědět | | Sbalit | Link | Blokovat | Admin
http://search.cpan.org/~gaas/HTML-Parser-3.55/Parser.pm

... anebo to můžete dělat "prasácky" pomocí regulárních výrazů...
16.8.2006 11:07 happy barney | skóre: 34 | blog: dont_worry_be_happy
Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
dalsi vhodny package: HTML::TreeBuilder
(i ked v tomto pripade by mozno bolo jednoduchsie pouzit ten regularny vyraz :-) )
16.8.2006 10:51 klobouk | skóre: 2
Rozbalit Rozbalit vše Re: Ako v perli vytiahnut data z html?
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nevim jak na to v Perlu, ale moc se tesim na reseni od Jana Martinka :-) Myslim, ze by sva roztomila kratka pythonovska dilka mel probrat a v nejake ucelenejsi forme je nekde vystavit jako FAQ nebo tak neco. Myslim, ze na inspiraci pro reseni jinych problemu by to byl vynikajici zdroj pro lidi, kteri by chteli zacit Python vyuzivat v beznem zivote :-)
Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.