abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 11:22 | Bezpečnostní upozornění

    Úřad pro ochranu osobních údajů řeší desítky stížností na jednotné měsíční hlášení zaměstnavatele, které stát spustil počátkem dubna. Systém, jenž má firmám odlehčit od desítek formulářů, nejenže výrazně zatížil jejich účetní oddělení, ale docházelo v něm i k únikům osobních dat zaměstnanců k firmám, kde nepracovali. Podle ministerstva práce a sociálních věcí stála za problémem technická chyba. „Incident se týkal několika stovek

    … více »
    Ladislav Hagara | Komentářů: 2
    dnes 10:46 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 22.0.0 open source webového aplikačního frameworku Angular (Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Nová verze

    Vim Classic byl vydán ve verzi 8.3. Drew DeVault oznámil tento fork editoru Vim (verze 8.2.0148, tj. těsně před zavedením Vim9 skriptování) v březnu letošního roku. Důvodem forku bylo, že vývojáři editorů Vim a Neovim začali při vývoji využívat LLM.

    Ladislav Hagara | Komentářů: 5
    dnes 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Google Chrome 149 byl prohlášen za stabilní. Nejnovější stabilní verze 149.0.7827.53 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 10:55 | Nová verze

    Pluto.jl, reaktivní notebook pro programovací jazyk Julia, dospěl do verze 1.0.

    Ladislav Hagara | Komentářů: 4
    2.6. 13:44 | Nová verze

    Byla vydána nová verze 12.0.0 vizuálního programovacího jazyka Snap! (Wikipedie) inspirovaného jazykem Scratch (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:44 | IT novinky

    Počítačovou hru Gravity Circuit (ProtonDB) lze do 14. června do 19:00 získat na Steamu zdarma. Napořád.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1816 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: PDF do textu

    5.4.2006 14:03 JFK
    PDF do textu
    Přečteno: 414×
    Ahoj, chtel bych se zeptat jestli nekdo nevi o nakem sikovnem programku, ktery by byl schopny z PDF-ka vytvorit textak a vystrihat z toho samostatne nekam obrazky. Uplne idealni by bylo kdyby to zvladl prekonvertovat rovnou do OO, ale to bych chtel uz asi moc ;-).

    Zatim se mi nic podobneho nepovedlo sehnat.

    Dik

    Odpovědi

    5.4.2006 14:12 wlofy
    Rozbalit Rozbalit vše Re: PDF do textu
    Existuje program pdf2txt ale je jenom pod windows ale funguje i pod wine. Dal existuje program se stejnym nazvem pro DOS ale ted na nej nemuzu najit odkaz. Pro linux o nicem nevim. Samozrejme taky zalezi co presne chces protoze muzes treba acrobatreaderu oznacit text a zkopirovat kam potrebujes, muze se ale stat ze pdf je zaheslovane a ktextu se takhle jednoduse nedostanes. Pak ti pomuze leda rozpoznavani textu treba finereader
    5.4.2006 14:22 JFK
    Rozbalit Rozbalit vše Re: PDF do textu
    No ja potrebuju proste nak rychle a bezbolestne prekonvertovat normalni nezaheslovany PDFko do textaku, problem je v tom, ze tam je spousta grafu a tak, tak by bylo fajn, kdyby to umelo nak i ty obrazky nekam vystrihnout. Je toho fakt dost a vystrihovat v AcroR se mi to fakt nechce. pdf2txt jsem mel na svojem starem RadHat 7, ale ted to nemuzu jaksi najit a tusim, ze to neumelo pracovat s tema obrazkama.

    Uplne idealni by bylo kdyby to umelo obraceny postup jako se v OO tvori PDF-ko z textu, tak opacne, aby tam bylo zachovano i neco z formatovani, ale jak rikam, tohle je asi sci-fi a bude mi bohate stacit jen kdyz to zvladne ty obrazky nak rozumne vytahnout ven.
    5.4.2006 14:28 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: PDF do textu
    Já jsem na tohle celkem úspěšně použil kwrite. I když výsledek nebyl přesně totéž, dalo se to zpracovat a použít.
    5.4.2006 14:30 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: PDF do textu
    Zasr.. doplňování formulářů...
    5.4.2006 14:15 #Tom
    Rozbalit Rozbalit vše Re: PDF do textu
    Z balíku XPDF lze použít pdftotext, i když jeho výstup bude s vysokou pravděpodobností na nic. No a na obrázky je pdfimages, okopíruje zevnítř JPEG a ostatní převede na PNM.
    5.4.2006 14:17 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: PDF do textu
    Součástí xpdf je utilitka pdftotext, která pdf převede na textový soubor. Jak z pdf dostat obrázky nevím. Možná pomocí pdftohtml.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    5.4.2006 14:37 xkesh | skóre: 46 | blog: eXtempore
    Rozbalit Rozbalit vše Re: PDF do textu
    Mam dojem, ze PDF je z principu format, ktery ma prave toto kopirovani a nasledne pouzivani v novem dokumentu ponekud ztizit, nebot ucelem je, aby prijemce (a jeho aplikace) co nejmene zobrazeni dokumentu ovlivnily, je nejjednodussi, pokud delate neco legalniho, pozadat autora dokumentu, aby vam poskytl podklady, z ktery PDF vytvarel, ve zpracovatelnem formatu.

    Je mi jasne, ze nekdy to mozne neni, je podle me ale taky kravina, vymenovat ci zalohovat si dokumenty jako PDF, kdyz jsou urceny k dalsimu zpracovani. Casto takhle clovek vezme cizi PDF a doslova si to okopiruje do svoji prace... nevim, proc by tohle melo byt usnadnovano :P
    5.4.2006 14:44 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: PDF do textu
    Nemyslím, že by se tohle mělo řešit v diskuzích. Měly by tu být věcné odpovědi na věcné otázky. Morální/právní aspekt nechme vyřešit tazatele.

    Zbraně nezabíjejí, zabíjejí lidé.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    5.4.2006 15:03 xkesh | skóre: 46 | blog: eXtempore
    Rozbalit Rozbalit vše Re: PDF do textu
    Nejde o moralku, jde o vhodne pouziti vhodnych prostredku ke stanovenemu cili. Aneb kdyz nekdo bude zadat radu, jake auto si poridit na cestu 1x za mesic, tak mu taky poradim, aby zapremyslel o taxiku. Alternativy k pozadovanemu reseni jsou taky odpovedi - a mnohdy z nich clovek profituje vic nez z vyreseni sve puvodni otazky ;)

    Tak to aspon vidim ja.
    5.4.2006 16:15 JFK
    Rozbalit Rozbalit vše Re: PDF do textu
    Ja mam zase dojem, ze PDF je ceneny predevsim kvuli sve prenositelnosti mezi operacnimi systemy a nemeni se jeho verze tak jako napriklas v MS Office. Ten kdo chce branit prenosu textu to jeste vetsinou zahesluje.

    Ja konkretne resim problem, ze moje snoubenka dela ve statni sprave a ma pro naky zviratko napsat a zkompletovat do jedne zpravy nekolik dilcich sprav z ruznych resortu. Jenze jak uz to tak bejva, tak urednici jsou hovadka a kazdej tu svoji praci poslal v jinym formatu (necekane i v PDF). Bohuzel vyzadat si text v pouzitelne forme neni nekdy uplne mozne, kdo nekdy byl neco resit na uradu, tak urcite chape proc :-). To zviratko to chce v elektronicke forme a to v jednom dokumentu. Tak se snazim ji s tim nak pomoc aby se po vecerech mohla venovat i necemu jinemu ;-)

    Tak to jen tak na vysvetlenou, abych nevypadal jako nakej zlodejicek. Jinak dik za vsechny odpovedi. To pdfimages jak se zdi si neumi poradit s PNG.
    5.4.2006 15:00 Frankie
    Rozbalit Rozbalit vše Re: PDF do textu
    Pdf2txt umí krásně součást XPDF http://www.foolabs.com/xpdf/ - utilitka pdf2text. Funguje pod windows i pod linuxem. Umí správně převádět i češtinu - narozdíl od množství win-shareware programů. XPDF má ještě pdfimages, která z pdf vyhází obrázky. Bohužel ale ne všechny. Myslím, že u vektorových obrázků to nezabírá. PS: K té češtině je potřeba ftp://ftp.foolabs.com/pub/xpdf/xpdf-latin2.tar.gz

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.