Portál AbcLinuxu, 10. května 2025 04:45

Dotaz: Jak převést HTML na text se správným kódováním?

30.11.2006 17:55 Lukáš Zapletal | skóre: 42 | blog: lzapův svět | Olomouc
Jak převést HTML na text se správným kódováním?
Přečteno: 226×
Odpovědět | Admin
Dobrý den,

snažím se použít příkaz lynx --dump -nolist, ale ačkoli mají HTML soubory na disku sprátně nastavené kódování (v hlavičce META), tak výstup lynxu je (pokaždé) špatný.

Nějaký jiný (ověřený) příkaz/program?

Díky in advance
Later --- Lukáš Zapletal
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

30.11.2006 18:15 razor | skóre: 33
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
Odpovědět | | Sbalit | Link | Blokovat | Admin
w3m (neověřený).
30.11.2006 21:57 vend | skóre: 19
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
Odpovědět | | Sbalit | Link | Blokovat | Admin

Myslím, že nastavení znakové sady v lynxu je jen v konfiguračním scriptu. Automatické nefunguje, pokud se něco nezměnilo.

Jinak já používám links -> Soubor -> Ulož zformátovaný dokument. Ale nemám to zmechanizivané :-)

30.11.2006 22:03 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
links -dump {URL}|{SOUBOR}. Jen nevim, jak to dopadne s UTF-8.
30.11.2006 22:04 finn | skóre: 43 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
links -dump <url>
Užívej dne – možná je tvůj poslední.
1.12.2006 08:24 Jiří Lisický | skóre: 31 | blog: JIL_blog | Olomouc
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
links má i parametr -dump-charset: Kódová stránka, ve které by měl být prezentován výstup -dump
30.11.2006 22:30 Messa | skóre: 39 | blog: Messa
Rozbalit Rozbalit vše Re: Jak převést HTML na text se správným kódováním?
Odpovědět | | Sbalit | Link | Blokovat | Admin
Co tohle?
lynx --dump --nolist --display_charset=utf-8 www.abclinuxu.cz

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.