abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:55 | Bezpečnostní upozornění

    Příspěvek na blogu Ubuntu upozorňuje na několik zranitelností v rozšíření Linuxu o mandatorní řízení přístupu AppArmor. Společně jsou označovány jako CrackArmor. Objevila je společnost Qualys (technické detaily). Neprivilegovaný lokální uživatel se může stát rootem. Chyba existuje od roku 2017. Doporučuje se okamžitá aktualizace. Problém se týká Ubuntu, Debianu nebo SUSE. Red Hat nebo Fedora pro mandatorní řízení přístupu používají SELinux.

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Nová verze

    Byla vydána nová verze 19 integrovaného vývojového prostředí (IDE) Qt Creator. Podrobný přehled novinek v changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 03:44 | Nová verze

    Bitwig Studio (Wikipedie) bylo vydáno ve verzi 6. Jedná se o proprietární multiplatformní (macOS, Windows, Linux) digitální pracovní stanici pro práci s audiem (DAW).

    Ladislav Hagara | Komentářů: 4
    včera 02:11 | Komunita

    Společnost Igalia představila novou linuxovou distribuci (framework) s názvem Moonforge. Jedná se o distribuci určenou pro vestavěné systémy. Vychází z projektů Yocto a OpenEmbedded.

    Ladislav Hagara | Komentářů: 0
    včera 00:44 | Nová verze

    Google Chrome 146 byl prohlášen za stabilní. Nejnovější stabilní verze 146.0.7680.71 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 29 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 00:22 | Nová verze

    D7VK byl vydán ve verzi 1.5. Jedná se o fork DXVK implementující překlad volání Direct3D 3 (novinka), 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 0
    11.3. 23:22 | Nová verze

    Bylo vydáno Eclipse IDE 2026-03 aneb Eclipse 4.39. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 4
    11.3. 10:22 | Upozornění

    Ze systému Slavia pojišťovny uniklo přibližně 150 gigabajtů citlivých dat. Jedná se například o pojistné dokumenty, lékařské záznamy nebo přímou komunikaci s klienty. Za únik může chyba dodavatelské společnosti.

    Ladislav Hagara | Komentářů: 12
    11.3. 10:11 | IT novinky

    Sněmovna propustila do dalšího kola projednávání vládní návrh zákona o digitální ekonomice, který má přinést bezpečnější on-line prostředí. Reaguje na evropské nařízení DSA o digitálních službách a upravuje třeba pravidla pro on-line tržiště nebo sociální sítě a má i víc chránit děti.

    Ladislav Hagara | Komentářů: 34
    11.3. 09:33 | IT novinky

    Meta převezme sociální síť pro umělou inteligenci (AI) Moltbook. Tvůrci Moltbooku – Matt Schlicht a Ben Parr – se díky dohodě stanou součástí Meta Superintelligence Labs (MSL). Meta MSL založila s cílem sjednotit své aktivity na poli AI a vyvinout takovou umělou inteligenci, která překoná lidské schopnosti v mnoha oblastech. Fungovat by měla ne jako centralizovaný nástroj, ale jako osobní asistent pro každého uživatele.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (16%)
     (7%)
     (0%)
     (11%)
     (29%)
     (2%)
     (5%)
     (2%)
     (13%)
     (25%)
    Celkem 1060 hlasů
     Komentářů: 26, poslední včera 08:56
    Rozcestník

    Dotaz: perl - vypreparovani textu z html

    11.12.2007 01:53 motorcb | skóre: 12
    perl - vypreparovani textu z html
    Přečteno: 641×
    Zdravim. Chtel bych se zeptat jestli je pomoci perlu mozne vypreparovat pouze text z html stranky... Nemate nekdo takovy script?

    Odpovědi

    11.12.2007 05:35 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Po zadání do Googlu mi jako první výsledek vypadl modul HTML::FormatText, zkoušel si ho?
    11.12.2007 07:51 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    - s/<[^>]+>//gs
    - HTML::Parser
    - HTML::Tree
    11.12.2007 11:19 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Take nevim jak se na to mam Google zeptat :( Protoze to sotva dokazu popsat 2 vetama cesky :) V tom je taky velky problem :(
    11.12.2007 11:36 ams
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Kdyz jde o Perl, prvni misto kde je vhodne zacit hledat je CPAN. Kdyz tam zadate napr. "html extract text" tak dostanete jako prvni odkaz modul File::Extract::HTML. Pak uz staci
    use File::Extract::HTML;
    print File::Extract::HTML::extract("soubor.html");
    
    11.12.2007 12:37 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    #!/usr/bin/perl
    use File::Extract::HTML;
    print File::Extract::HTML::extract("pokus.html");
    
    Hlasi:
    delli:~/perl# ./htmlparser.pl
    Can't locate File/Extract/HTML.pm in @INC (@INC contains: /etc/perl /usr/local/lib/perl/5.8.8 /usr/local/share/perl/5.8.8 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.8 /usr/share/perl/5.8 /usr/local/lib/site_perl .) at ./htmlparser.pl line 3.
    BEGIN failed--compilation aborted at ./htmlparser.pl line 3.
    
    11.12.2007 12:39 myšák | skóre: 26 | blog: EmentuX | Ostrava
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html

    No ale když ten modul nemáte (velmi pravděpodobně) nainstalovaný, tak ho asi těžko můžete použít...

    Je nesmírně těžké být idiotem, konkurence je obrovská...
    11.12.2007 12:44 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ano, s nejvetsi pravdepodobnosti ho nemam nainstalovany. Jak se prosim nainstaluje? Diky
    11.12.2007 12:57 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    To záleží na distribuci..
    11.12.2007 12:59 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Mohlo by stačit nakopírovat někam tenhle soubor, pokud na tento modul nemáte balíček. Ale kam ho nakopírovat IMHO záleží na distribuci.
    11.12.2007 13:05 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    perl -MCPAN -e 'install File::Extract::HTML'
    11.12.2007 13:39 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Distribuce Debian
    delli:~# perl -MCPAN -e 'install File::Extract::HTML'
    CPAN: Storable loaded ok
    Going to read /root/.cpan/Metadata
      Database was generated on Tue, 11 Dec 2007 00:37:43 GMT
    File::Extract::HTML is up to date.
    delli:~# mc
    delli:~/perl# ./htmlparser.pl
    Can't locate object method "mime_type" via package "test.html" (perhaps you forgot to load "test.html"?) at /usr/local/share/perl/5.8.8/File/Extract/HTML.pm line 25.
    
    11.12.2007 13:52 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Manualova stranka nefunguje? Sice vim, co je spatne, ale kdyz vidim tak malo snahy... se mi skoro nechce ani radit...
    11.12.2007 13:56 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Opravdu nevim pod cim by se to nechalo najit :(
    11.12.2007 14:09 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Prekvapive

    man File::Extract::HTML

    a

    man File::Extract

    a

    man File::Extract::Result
    11.12.2007 13:55 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Asi takhle by to mohlo fungovat (ale nemam vyzkouseno):
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract($filename);
    print $r->text;
    
    11.12.2007 14:23 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Funguje to super,ale neslo by to jeste poupravit aby to davalo mezery mezi to co bylo v tagach? ted to dela toto:

    kdyz mam nekolik odkazu za sebou v li,tak ty odkazy tocpe hned za sebe a je bych mezi ne potreboval mezery.HOMEAKTUALITYNOVINKY a ja bych mezi ty tagy potreboval dat mezeru HOME AKTUALITY NOVINKY Jinak by to bylo uplne dokonaly :) Nevedel by nekdo jak na to?
    12.12.2007 13:01 mlz
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Nesystemové: s/<LI>/  c; /gi Nejsem si jist, umí-li FILE::EXTRACT entity

    Systemově HTML::Parser, který dokáže definovat, co s jednotlivými tokeny/tagy
    22.12.2007 23:20 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ukázková html stránka:

    <html>

    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Jednoduchá www stránkalt;/title>
    </head>

    <body>

    <p>Ví­tejte na mé jednoduché www stránce</p>

    Menu:
    <ul>
    <li>Home</li>
    <li>Aktuality</li>
    <li>Ostatnbí</li>
    <li>Položka</li>
    </ul<

    Tabulka:
    <table>
    <tr>
    <td width="25%">řádek1</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek2</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek3</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">loupec3</td>
    </tr>
    </table>

    </body>
    </html>
    Na kterou byl poslan tento script:

    #!/usr/bin/perl
    #use File::Extract::HTML;
    #print File::Extract::HTML::extract("test.html");
    open(SOUBOR, ">soubor.txt");
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract("test.html");
    print SOUBOR $r->text;
    close(SOUBOR);


    Vyplivne:

    Jednoduchá www stránkaVítejte na mé jednoduché www stránce Menu: HomeAktualityOstatnbíPoložka Tabulka: řádek1sloupec1sloupec2sloupec3řádek2sloupec1sloupec2sloupec3řádek3sloupec1sloupec2sloupec3

    A ja bych potreboval aby byli mezi jednotlivyma polozkama mezery: Jednoduchá www stránka Vítejte na mé jednoduché www stránce Menu: Home Aktuality Ostatnbí Položka Tabulka: řádek1 sloupec1 sloupec2 sloupec3 řádek2 sloupec1 sloupec2 sloupec3 řádek3 sloupec1 sloupec2 sloupec3
    Nevedel by nekdo? Predem kekuji :)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.