abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 11:33 | Pozvánky

Konference LinuxDays 2017 proběhne o víkendu 7. a 8. října v Praze v Dejvicích v prostorách FIT ČVUT. Konference OpenAlt 2017 proběhne o víkendu 4. a 5. listopadu na FIT VUT v Brně. Organizátoři konferencí vyhlásili CFP (LinuxDays, OpenAlt). Přihlaste svou přednášku nebo doporučte konference známým.

Ladislav Hagara | Komentářů: 0
včera 06:00 | Nová verze

Byla vydána verze 1.3.0 odlehčeného desktopového prostředí Lumina (Wikipedie, GitHub) postaveného nad toolkitem Qt. Z novinek lze zmínit nový motiv ikon nahrazující Oxygen (material-design-[light/dark]) nebo vlastní multimediální přehrávač (lumina-mediaplayer).

Ladislav Hagara | Komentářů: 2
26.6. 17:33 | Bezpečnostní upozornění

Před šesti týdny byly publikovány výsledky bezpečnostního auditu zdrojových kódů OpenVPN a nalezené bezpečnostní chyby byly opraveny ve verzi OpenVPN 2.4.2. Guido Vranken minulý týden oznámil, že v OpenVPN nalezl další čtyři bezpečnostní chyby (CVE-2017-7520, CVE-2017-7521, CVE-2017-7522 a CVE-2017-7508). Nejzávažnější z nich se týká způsobu, jakým aplikace zachází s SSL certifikáty. Vzdálený útočník může pomocí speciálně

… více »
Ladislav Hagara | Komentářů: 1
26.6. 06:55 | Zajímavý projekt

V Edici CZ.NIC vyšla kniha Průvodce labyrintem algoritmů. Kniha je ke stažení zcela zdarma (pdf) nebo lze objednat tištěnou verzi za 339 Kč (připojení přes IPv4) nebo 289 Kč (připojení přes IPv6).

Ladislav Hagara | Komentářů: 6
26.6. 06:33 | Zajímavý software

Byla vydána verze 2.2.0 svobodného správce hesel KeePassXC (Wikipedie). Jedná se o komunitní fork správce hesel KeePassX s řadou vylepšení.

Ladislav Hagara | Komentářů: 0
26.6. 06:11 | IT novinky

Vývojář Debianu Henrique de Moraes Holschuh upozorňuje v diskusním listu debian-devel na chybu v Hyper-Threadingu v procesorech Skylake a Kaby Lake od Intelu. Za určitých okolností může chyba způsobit nepředvídatelné chování systému. Doporučuje se aktualizace mikrokódu CPU nebo vypnutí Hyper-Threadingu v BIOSu nebo UEFI [reddit].

Ladislav Hagara | Komentářů: 0
24.6. 01:23 | Komunita

Phoronix spustil 2017 Linux Laptop Survey. Tento dotazník s otázkami zaměřenými na parametry ideálního notebooku s Linuxem lze vyplnit do 6. července.

Ladislav Hagara | Komentářů: 3
23.6. 22:44 | Nová verze

Po třech měsících vývoje od vydání verze 5.5.0 byla vydána verze 5.6.0 správce digitálních fotografií digiKam (digiKam Software Collection). Do digiKamu se mimo jiné vrátila HTML galerie a nástroj pro vytváření videa z fotografií. V Bugzille bylo uzavřeno více než 81 záznamů.

Ladislav Hagara | Komentářů: 1
23.6. 17:44 | Nová verze

Byla vydána verze 9.3 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab. Představení nových vlastností v příspěvku na blogu a na YouTube.

Ladislav Hagara | Komentářů: 3
23.6. 13:53 | Nová verze

Simon Long představil na blogu Raspberry Pi novou verzi 2017-06-21 linuxové distribuce Raspbian určené především pro jednodeskové miniaturní počítače Raspberry Pi. Společně s Raspbianem byl aktualizován také instalační nástroj NOOBS (New Out Of the Box Software). Z novinek lze zdůraznit IDE Thonny pro vývoj v programovacím jazyce Python a především offline verzi Scratche 2.0. Ten bylo dosud možné používat pouze online. Offline bylo možné používat pouze Scratch ve verzi 1.4. Z nového Scratchu lze ovládat také GPIO piny. Scratch 2.0 vyžaduje Flash.

Ladislav Hagara | Komentářů: 2
Chystáte se pořídit CPU AMD Ryzen?
 (6%)
 (31%)
 (1%)
 (9%)
 (44%)
 (9%)
Celkem 851 hlasů
 Komentářů: 65, poslední 1.6. 19:16
    Rozcestník

    Dotaz: perl - vypreparovani textu z html

    11.12.2007 01:53 motorcb | skóre: 12
    perl - vypreparovani textu z html
    Přečteno: 581×
    Zdravim. Chtel bych se zeptat jestli je pomoci perlu mozne vypreparovat pouze text z html stranky... Nemate nekdo takovy script?

    Odpovědi

    11.12.2007 05:35 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Po zadání do Googlu mi jako první výsledek vypadl modul HTML::FormatText, zkoušel si ho?
    11.12.2007 07:51 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    - s/<[^>]+>//gs
    - HTML::Parser
    - HTML::Tree
    11.12.2007 11:19 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Take nevim jak se na to mam Google zeptat :( Protoze to sotva dokazu popsat 2 vetama cesky :) V tom je taky velky problem :(
    11.12.2007 11:36 ams
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Kdyz jde o Perl, prvni misto kde je vhodne zacit hledat je CPAN. Kdyz tam zadate napr. "html extract text" tak dostanete jako prvni odkaz modul File::Extract::HTML. Pak uz staci
    use File::Extract::HTML;
    print File::Extract::HTML::extract("soubor.html");
    
    11.12.2007 12:37 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    #!/usr/bin/perl
    use File::Extract::HTML;
    print File::Extract::HTML::extract("pokus.html");
    
    Hlasi:
    delli:~/perl# ./htmlparser.pl
    Can't locate File/Extract/HTML.pm in @INC (@INC contains: /etc/perl /usr/local/lib/perl/5.8.8 /usr/local/share/perl/5.8.8 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.8 /usr/share/perl/5.8 /usr/local/lib/site_perl .) at ./htmlparser.pl line 3.
    BEGIN failed--compilation aborted at ./htmlparser.pl line 3.
    
    11.12.2007 12:39 myšák | skóre: 26 | blog: EmentuX | Ostrava
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html

    No ale když ten modul nemáte (velmi pravděpodobně) nainstalovaný, tak ho asi těžko můžete použít...

    Je nesmírně těžké být idiotem, konkurence je obrovská...
    11.12.2007 12:44 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ano, s nejvetsi pravdepodobnosti ho nemam nainstalovany. Jak se prosim nainstaluje? Diky
    Marek Stopka avatar 11.12.2007 12:57 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Marek Stopka avatar 11.12.2007 12:59 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Mohlo by stačit nakopírovat někam tenhle soubor, pokud na tento modul nemáte balíček. Ale kam ho nakopírovat IMHO záleží na distribuci.
    11.12.2007 13:05 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    perl -MCPAN -e 'install File::Extract::HTML'
    11.12.2007 13:39 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Distribuce Debian
    delli:~# perl -MCPAN -e 'install File::Extract::HTML'
    CPAN: Storable loaded ok
    Going to read /root/.cpan/Metadata
      Database was generated on Tue, 11 Dec 2007 00:37:43 GMT
    File::Extract::HTML is up to date.
    delli:~# mc
    delli:~/perl# ./htmlparser.pl
    Can't locate object method "mime_type" via package "test.html" (perhaps you forgot to load "test.html"?) at /usr/local/share/perl/5.8.8/File/Extract/HTML.pm line 25.
    
    11.12.2007 13:52 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Manualova stranka nefunguje? Sice vim, co je spatne, ale kdyz vidim tak malo snahy... se mi skoro nechce ani radit...
    11.12.2007 13:56 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Opravdu nevim pod cim by se to nechalo najit :(
    11.12.2007 14:09 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Prekvapive

    man File::Extract::HTML

    a

    man File::Extract

    a

    man File::Extract::Result
    11.12.2007 13:55 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Asi takhle by to mohlo fungovat (ale nemam vyzkouseno):
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract($filename);
    print $r->text;
    
    11.12.2007 14:23 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Funguje to super,ale neslo by to jeste poupravit aby to davalo mezery mezi to co bylo v tagach? ted to dela toto:

    kdyz mam nekolik odkazu za sebou v li,tak ty odkazy tocpe hned za sebe a je bych mezi ne potreboval mezery.HOMEAKTUALITYNOVINKY a ja bych mezi ty tagy potreboval dat mezeru HOME AKTUALITY NOVINKY Jinak by to bylo uplne dokonaly :) Nevedel by nekdo jak na to?
    12.12.2007 13:01 mlz
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Nesystemové: s/<LI>/  c; /gi Nejsem si jist, umí-li FILE::EXTRACT entity

    Systemově HTML::Parser, který dokáže definovat, co s jednotlivými tokeny/tagy
    22.12.2007 23:20 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ukázková html stránka:

    <html>

    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Jednoduchá www stránkalt;/title>
    </head>

    <body>

    <p>Ví­tejte na mé jednoduché www stránce</p>

    Menu:
    <ul>
    <li>Home</li>
    <li>Aktuality</li>
    <li>Ostatnbí</li>
    <li>Položka</li>
    </ul<

    Tabulka:
    <table>
    <tr>
    <td width="25%">řádek1</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek2</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek3</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">loupec3</td>
    </tr>
    </table>

    </body>
    </html>
    Na kterou byl poslan tento script:

    #!/usr/bin/perl
    #use File::Extract::HTML;
    #print File::Extract::HTML::extract("test.html");
    open(SOUBOR, ">soubor.txt");
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract("test.html");
    print SOUBOR $r->text;
    close(SOUBOR);


    Vyplivne:

    Jednoduchá www stránkaVítejte na mé jednoduché www stránce Menu: HomeAktualityOstatnbíPoložka Tabulka: řádek1sloupec1sloupec2sloupec3řádek2sloupec1sloupec2sloupec3řádek3sloupec1sloupec2sloupec3

    A ja bych potreboval aby byli mezi jednotlivyma polozkama mezery: Jednoduchá www stránka Vítejte na mé jednoduché www stránce Menu: Home Aktuality Ostatnbí Položka Tabulka: řádek1 sloupec1 sloupec2 sloupec3 řádek2 sloupec1 sloupec2 sloupec3 řádek3 sloupec1 sloupec2 sloupec3
    Nevedel by nekdo? Predem kekuji :)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.