abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 20:33 | Zajímavý článek

Nadace Raspberry Pi vydala sedmašedesáté číslo (pdf) anglicky psaného časopisu MagPi věnovanému Raspberry Pi a projektům postaveným na tomto jednodeskovém počítači a čtvrté číslo (pdf) časopisu pro kutily HackSpace věnovanému navíc 3D tisku, pájení, řezání nebo i elektronice a IoT.

Ladislav Hagara | Komentářů: 0
dnes 18:33 | Komunita

Morevna Project, který stojí za řadou svobodného softwaru pro animátory (např. Synfig Studio, RenderChan nebo Papagayo-NG) a svobodnými (CC-BY-SA) animovanými filmy/komiksy Morevna (3. díl) a Pepper&Carrot: The Potion Contest (6. díl), sbírá do 1. března příspěvky na 4. díl svého animovaného filmu Morevna. Mezi odměnami přispěvatelům lze najít např. i videokurzy animace v Synfigu či Blenderu.

xHire | Komentářů: 0
dnes 12:22 | Bezpečnostní upozornění

Ve středu vydaná "npm@next" verze 5.7.0 správce balíčků pro JavaScript npm (Wikipedie, Node Package Manager) přinesla řadě uživatelů Linuxu nečekanou nepříjemnost. V závislosti na způsobu instalace a ve spojení s příkazem sudo mohlo dojít ke změně vlastníka u systémových souborů, také například /. Chyba je opravena v před několika hodinami vydané verzi npm 5.7.1 [reddit].

Ladislav Hagara | Komentářů: 8
dnes 10:00 | Nová verze

Byla vydána verze 10.5 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností v příspěvku na blogu. Zdůraznit lze integrovanou podporu Let's Encrypt.

Ladislav Hagara | Komentářů: 0
včera 12:33 | Komunita

Příspěvek na blogu Signalu (Wikipedie) informuje o založení neziskové nadace Signal Foundation, jež bude zastřešovat další vývoj tohoto svobodného bezpečného komunikátoru běžícího také na Linuxu (Signal Desktop). Brian Acton, spoluzakladatel WhatsAppu, věnoval nadaci 50 milionů dolarů [Hacker News].

Ladislav Hagara | Komentářů: 1
včera 05:55 | Zajímavý článek

Článek na Fedora Magazine krátce představuje programovací jazyk Rust a několik zajímavých v Rustu naprogramovaných terminálových aplikací. Jedná se o alternativu k příkazu grep ripgrep, moderní barevnou alternativu k příkazu ls exa, příkazem cloc inspirovaný tokei a zvířátko v terminálu ternimal.

Ladislav Hagara | Komentářů: 0
21.2. 23:55 | Zajímavý projekt

Byl spuštěn Humble Classics Return Bundle. Za vlastní cenu lze koupit hry Broken Sword 5 - The Serpent's Curse, Shadowrun Returns a Shadowrun: Dragonfall - Director's Cut. Při nadprůměrné platbě (aktuálně 8,48 $) také Shadowrun: Hong Kong - Extended Edition, Wasteland 2: Director's Cut - Standard Edition, Age of Wonders III a Xenonauts. Při platbě 15 $ a více lze získat navíc Torment: Tides of Numenera a Dreamfall Chapters: The Final Cut Edition.

Ladislav Hagara | Komentářů: 0
21.2. 00:11 | Bezpečnostní upozornění

Vývojáři linuxové distribuce Mageia na svém blogu upozorňují na narušení bezpečnosti Mageia Identity. Narušitel získal přístup k LDAP databázi a zveřejnil jména uživatelů, jejich emailové adresy a haše hesel. Hesla uživatelů byla resetována.

Ladislav Hagara | Komentářů: 3
20.2. 21:55 | Nová verze

Byla vydána verze 2.0.0 nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). Z novinek je nutno upozornit na nový zpětně nekompatibilní formát záznamu asciicast v2. S novým formátem si poradí nové verze asciinema-playeru a asciinema-serveru [Hacker News].

Ladislav Hagara | Komentářů: 0
20.2. 05:55 | Zajímavý projekt

Dle příspěvku na blogu zaměstnanců CZ.NIC byl spuštěn ostrý provoz služby Honeypot as a Service (HaaS). Zapojit se může kdokoli. Stačí se zaregistrovat a nainstalovat HaaS proxy, která začne příchozí komunikaci z portu 22 (běžně používaného pro SSH) přeposílat na server HaaS, kde honeypot Cowrie (GitHub) simuluje zařízení a zaznamenává provedené příkazy. Získat lze tak zajímavé informace o provedených útocích. K dispozici jsou globální statistiky.

Ladislav Hagara | Komentářů: 12
Který webový vyhledávač používáte nejčastěji?
 (2%)
 (28%)
 (62%)
 (3%)
 (3%)
 (0%)
 (1%)
 (1%)
Celkem 437 hlasů
 Komentářů: 35, poslední 21.2. 19:51
    Rozcestník

    Dotaz: perl - vypreparovani textu z html

    11.12.2007 01:53 motorcb | skóre: 12
    perl - vypreparovani textu z html
    Přečteno: 581×
    Zdravim. Chtel bych se zeptat jestli je pomoci perlu mozne vypreparovat pouze text z html stranky... Nemate nekdo takovy script?

    Odpovědi

    11.12.2007 05:35 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Po zadání do Googlu mi jako první výsledek vypadl modul HTML::FormatText, zkoušel si ho?
    11.12.2007 07:51 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    - s/<[^>]+>//gs
    - HTML::Parser
    - HTML::Tree
    11.12.2007 11:19 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Take nevim jak se na to mam Google zeptat :( Protoze to sotva dokazu popsat 2 vetama cesky :) V tom je taky velky problem :(
    11.12.2007 11:36 ams
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Kdyz jde o Perl, prvni misto kde je vhodne zacit hledat je CPAN. Kdyz tam zadate napr. "html extract text" tak dostanete jako prvni odkaz modul File::Extract::HTML. Pak uz staci
    use File::Extract::HTML;
    print File::Extract::HTML::extract("soubor.html");
    
    11.12.2007 12:37 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    #!/usr/bin/perl
    use File::Extract::HTML;
    print File::Extract::HTML::extract("pokus.html");
    
    Hlasi:
    delli:~/perl# ./htmlparser.pl
    Can't locate File/Extract/HTML.pm in @INC (@INC contains: /etc/perl /usr/local/lib/perl/5.8.8 /usr/local/share/perl/5.8.8 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.8 /usr/share/perl/5.8 /usr/local/lib/site_perl .) at ./htmlparser.pl line 3.
    BEGIN failed--compilation aborted at ./htmlparser.pl line 3.
    
    11.12.2007 12:39 myšák | skóre: 26 | blog: EmentuX | Ostrava
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html

    No ale když ten modul nemáte (velmi pravděpodobně) nainstalovaný, tak ho asi těžko můžete použít...

    Je nesmírně těžké být idiotem, konkurence je obrovská...
    11.12.2007 12:44 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ano, s nejvetsi pravdepodobnosti ho nemam nainstalovany. Jak se prosim nainstaluje? Diky
    Marek Stopka avatar 11.12.2007 12:57 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    To záleží na distribuci..
    Marek Stopka avatar 11.12.2007 12:59 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Mohlo by stačit nakopírovat někam tenhle soubor, pokud na tento modul nemáte balíček. Ale kam ho nakopírovat IMHO záleží na distribuci.
    11.12.2007 13:05 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    perl -MCPAN -e 'install File::Extract::HTML'
    11.12.2007 13:39 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Distribuce Debian
    delli:~# perl -MCPAN -e 'install File::Extract::HTML'
    CPAN: Storable loaded ok
    Going to read /root/.cpan/Metadata
      Database was generated on Tue, 11 Dec 2007 00:37:43 GMT
    File::Extract::HTML is up to date.
    delli:~# mc
    delli:~/perl# ./htmlparser.pl
    Can't locate object method "mime_type" via package "test.html" (perhaps you forgot to load "test.html"?) at /usr/local/share/perl/5.8.8/File/Extract/HTML.pm line 25.
    
    11.12.2007 13:52 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Manualova stranka nefunguje? Sice vim, co je spatne, ale kdyz vidim tak malo snahy... se mi skoro nechce ani radit...
    11.12.2007 13:56 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Opravdu nevim pod cim by se to nechalo najit :(
    11.12.2007 14:09 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Prekvapive

    man File::Extract::HTML

    a

    man File::Extract

    a

    man File::Extract::Result
    11.12.2007 13:55 outsider
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Asi takhle by to mohlo fungovat (ale nemam vyzkouseno):
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract($filename);
    print $r->text;
    
    11.12.2007 14:23 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Funguje to super,ale neslo by to jeste poupravit aby to davalo mezery mezi to co bylo v tagach? ted to dela toto:

    kdyz mam nekolik odkazu za sebou v li,tak ty odkazy tocpe hned za sebe a je bych mezi ne potreboval mezery.HOMEAKTUALITYNOVINKY a ja bych mezi ty tagy potreboval dat mezeru HOME AKTUALITY NOVINKY Jinak by to bylo uplne dokonaly :) Nevedel by nekdo jak na to?
    12.12.2007 13:01 mlz
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Nesystemové: s/<LI>/  c; /gi Nejsem si jist, umí-li FILE::EXTRACT entity

    Systemově HTML::Parser, který dokáže definovat, co s jednotlivými tokeny/tagy
    22.12.2007 23:20 motorcb | skóre: 12
    Rozbalit Rozbalit vše Re: perl - vypreparovani textu z html
    Ukázková html stránka:

    <html>

    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <title>Jednoduchá www stránkalt;/title>
    </head>

    <body>

    <p>Ví­tejte na mé jednoduché www stránce</p>

    Menu:
    <ul>
    <li>Home</li>
    <li>Aktuality</li>
    <li>Ostatnbí</li>
    <li>Položka</li>
    </ul<

    Tabulka:
    <table>
    <tr>
    <td width="25%">řádek1</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek2</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">sloupec3</td>
    </tr>
    <tr>
    <td width="25%">řádek3</td>
    <td width="25%">sloupec1</td>
    <td width="25%">sloupec2</td>
    <td width="25%">loupec3</td>
    </tr>
    </table>

    </body>
    </html>
    Na kterou byl poslan tento script:

    #!/usr/bin/perl
    #use File::Extract::HTML;
    #print File::Extract::HTML::extract("test.html");
    open(SOUBOR, ">soubor.txt");
    use File::Extract::HTML;
    my $e = File::Extract::HTML->new();
    my $r = $e->extract("test.html");
    print SOUBOR $r->text;
    close(SOUBOR);


    Vyplivne:

    Jednoduchá www stránkaVítejte na mé jednoduché www stránce Menu: HomeAktualityOstatnbíPoložka Tabulka: řádek1sloupec1sloupec2sloupec3řádek2sloupec1sloupec2sloupec3řádek3sloupec1sloupec2sloupec3

    A ja bych potreboval aby byli mezi jednotlivyma polozkama mezery: Jednoduchá www stránka Vítejte na mé jednoduché www stránce Menu: Home Aktuality Ostatnbí Položka Tabulka: řádek1 sloupec1 sloupec2 sloupec3 řádek2 sloupec1 sloupec2 sloupec3 řádek3 sloupec1 sloupec2 sloupec3
    Nevedel by nekdo? Predem kekuji :)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.