Portál AbcLinuxu, 25. dubna 2024 02:54


Dotaz: Odstranění html tagů z textu

16.2.2013 12:17 Jack Hokus | skóre: 34 | blog: LostHeaven
Odstranění html tagů z textu
Přečteno: 279×
Odpovědět | Admin
Ahoj,

kamarád mi poslal mnohastránkový text v PDF s tím, že to potřebuje vytisknout, jenže to PDF je tak mizerně udělané, že je vždycky půl stránky volné.

Napadlo mne, že z toho PDF vytáhnu text a vysázím jej znovu v LaTeXu. Pomocí přogramu text2html jsem udělal z pdf html, ale nevím, jak odstranit html tagy.

Našel jsem několik stránek, kde se to dá udělat online, ale to je dost otročina. Neporadil by mi někdo jak ten problém vyřešit?

PS: Vím, že se to dá udělat pomocí sktiptu, ale přiznávám, že jsem nikdy neprogramoval a nevím kudy na to

Petr
http://www.jackhokus.cz/

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Řešení 1× (=^..^= AmigaPower®)
16.2.2013 12:25 chrono
Rozbalit Rozbalit vše Re: Odstranění html tagů z textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Dá sa použiť priamo pdftotext (pre priamu konverziu do textu), prípadne lynx -dump (pre odstránenie html tagov), alebo LibreOffice.
16.2.2013 12:37 Jack Hokus | skóre: 34 | blog: LostHeaven
Rozbalit Rozbalit vše Re: Odstranění html tagů z textu
Dobrý den,

díky za typ. Pohohlo to. Našel jsem tenhle návod
http://www.jackhokus.cz/

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.