abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    včera 19:33 | Nová verze

    Bylo vydáno Ubuntu 20.04.6 LTS, tj. šesté opravné vydání Ubuntu 20.04 LTS s kódovým názvem Focal Fossa. Přehled novinek v poznámkách k vydání a v přehledu změn.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | IT novinky

    Připojit neznámý USB flash disk do počítače může být nebezpečné. Dokonce může jít i o život. Někdo rozeslal ekvádorským novinářům USB flash disky, které po připojení do počítače explodují [BBC, Twitter].

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | Nová verze

    Byla vydána nová verze 7.4 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu.

    Ladislav Hagara | Komentářů: 0
    22.3. 21:55 | Nová verze

    Byla vydána verze 11.0 s kódovým jménem Aramo linuxové distribuce Trisquel GNU/Linux. Založena je na Ubuntu 22.04 LTS a podporována bude do roku 2027. Trisquel patří mezi svobodné distribuce doporučované Nadací pro svobodný software (FSF).

    Ladislav Hagara | Komentářů: 0
    22.3. 16:55 | IT novinky

    Mozilla založila startup Mozilla.ai a vložila do něj 30 milionů dolarů. Cílem je vývoj důvěryhodné, nezávislé a open source AI.

    Ladislav Hagara | Komentářů: 2
    22.3. 16:33 | Nová verze

    Po půl roce vývoje od vydání verze 43 bylo vydáno GNOME 44 s kódovým názvem Kuala Lumpur. Přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře. Krátké představení na YouTube.

    Ladislav Hagara | Komentářů: 22
    22.3. 13:33 | IT novinky

    Letošní Turingovou cenu (2022 ACM A.M. Turing Award) získal Bob Metcalfe za vynalezení, standardizaci a komercializaci Ethernetu.

    Ladislav Hagara | Komentářů: 0
    22.3. 07:00 | Nová verze

    Svobodná webová platforma pro sdílení a přehrávání videí PeerTube (Wikipedie) byla vydána ve verzi 5.1. Přehled novinek i s náhledy v oficiálním oznámení a na GitHubu.

    Ladislav Hagara | Komentářů: 0
    21.3. 18:22 | Nová verze

    Byla vydána Java 20 / JDK 20. Nových vlastností (JEP - JDK Enhancement Proposal) je 7. Nová Java / JDK vychází každých 6 měsíců. LTS verze je 17.

    Ladislav Hagara | Komentářů: 7
    21.3. 16:44 | IT novinky

    Google spustil konverzační AI Bard. Vyzkoušet lze zatím pouze ve Spojených státech a Spojeném království. Více v Bard FAQ.

    Ladislav Hagara | Komentářů: 2
    Používáte WSL (Windows Subsystem for Linux)?
     (74%)
     (12%)
     (4%)
     (10%)
    Celkem 301 hlasů
     Komentářů: 3, poslední včera 12:45
    Rozcestník


    Dotaz: PDF do textu

    5.4.2006 14:03 JFK
    PDF do textu
    Přečteno: 335×
    Ahoj, chtel bych se zeptat jestli nekdo nevi o nakem sikovnem programku, ktery by byl schopny z PDF-ka vytvorit textak a vystrihat z toho samostatne nekam obrazky. Uplne idealni by bylo kdyby to zvladl prekonvertovat rovnou do OO, ale to bych chtel uz asi moc ;-).

    Zatim se mi nic podobneho nepovedlo sehnat.

    Dik

    Odpovědi

    5.4.2006 14:12 wlofy
    Rozbalit Rozbalit vše Re: PDF do textu
    Existuje program pdf2txt ale je jenom pod windows ale funguje i pod wine. Dal existuje program se stejnym nazvem pro DOS ale ted na nej nemuzu najit odkaz. Pro linux o nicem nevim. Samozrejme taky zalezi co presne chces protoze muzes treba acrobatreaderu oznacit text a zkopirovat kam potrebujes, muze se ale stat ze pdf je zaheslovane a ktextu se takhle jednoduse nedostanes. Pak ti pomuze leda rozpoznavani textu treba finereader
    5.4.2006 14:22 JFK
    Rozbalit Rozbalit vše Re: PDF do textu
    No ja potrebuju proste nak rychle a bezbolestne prekonvertovat normalni nezaheslovany PDFko do textaku, problem je v tom, ze tam je spousta grafu a tak, tak by bylo fajn, kdyby to umelo nak i ty obrazky nekam vystrihnout. Je toho fakt dost a vystrihovat v AcroR se mi to fakt nechce. pdf2txt jsem mel na svojem starem RadHat 7, ale ted to nemuzu jaksi najit a tusim, ze to neumelo pracovat s tema obrazkama.

    Uplne idealni by bylo kdyby to umelo obraceny postup jako se v OO tvori PDF-ko z textu, tak opacne, aby tam bylo zachovano i neco z formatovani, ale jak rikam, tohle je asi sci-fi a bude mi bohate stacit jen kdyz to zvladne ty obrazky nak rozumne vytahnout ven.
    5.4.2006 14:28 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: PDF do textu
    Já jsem na tohle celkem úspěšně použil kwrite. I když výsledek nebyl přesně totéž, dalo se to zpracovat a použít.
    5.4.2006 14:30 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: PDF do textu
    Zasr.. doplňování formulářů...
    5.4.2006 14:15 #Tom
    Rozbalit Rozbalit vše Re: PDF do textu
    Z balíku XPDF lze použít pdftotext, i když jeho výstup bude s vysokou pravděpodobností na nic. No a na obrázky je pdfimages, okopíruje zevnítř JPEG a ostatní převede na PNM.
    5.4.2006 14:17 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: PDF do textu
    Součástí xpdf je utilitka pdftotext, která pdf převede na textový soubor. Jak z pdf dostat obrázky nevím. Možná pomocí pdftohtml.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    5.4.2006 14:37 xkesh | skóre: 46 | blog: eXtempore
    Rozbalit Rozbalit vše Re: PDF do textu
    Mam dojem, ze PDF je z principu format, ktery ma prave toto kopirovani a nasledne pouzivani v novem dokumentu ponekud ztizit, nebot ucelem je, aby prijemce (a jeho aplikace) co nejmene zobrazeni dokumentu ovlivnily, je nejjednodussi, pokud delate neco legalniho, pozadat autora dokumentu, aby vam poskytl podklady, z ktery PDF vytvarel, ve zpracovatelnem formatu.

    Je mi jasne, ze nekdy to mozne neni, je podle me ale taky kravina, vymenovat ci zalohovat si dokumenty jako PDF, kdyz jsou urceny k dalsimu zpracovani. Casto takhle clovek vezme cizi PDF a doslova si to okopiruje do svoji prace... nevim, proc by tohle melo byt usnadnovano :P
    5.4.2006 14:44 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: PDF do textu
    Nemyslím, že by se tohle mělo řešit v diskuzích. Měly by tu být věcné odpovědi na věcné otázky. Morální/právní aspekt nechme vyřešit tazatele.

    Zbraně nezabíjejí, zabíjejí lidé.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    5.4.2006 15:03 xkesh | skóre: 46 | blog: eXtempore
    Rozbalit Rozbalit vše Re: PDF do textu
    Nejde o moralku, jde o vhodne pouziti vhodnych prostredku ke stanovenemu cili. Aneb kdyz nekdo bude zadat radu, jake auto si poridit na cestu 1x za mesic, tak mu taky poradim, aby zapremyslel o taxiku. Alternativy k pozadovanemu reseni jsou taky odpovedi - a mnohdy z nich clovek profituje vic nez z vyreseni sve puvodni otazky ;)

    Tak to aspon vidim ja.
    5.4.2006 16:15 JFK
    Rozbalit Rozbalit vše Re: PDF do textu
    Ja mam zase dojem, ze PDF je ceneny predevsim kvuli sve prenositelnosti mezi operacnimi systemy a nemeni se jeho verze tak jako napriklas v MS Office. Ten kdo chce branit prenosu textu to jeste vetsinou zahesluje.

    Ja konkretne resim problem, ze moje snoubenka dela ve statni sprave a ma pro naky zviratko napsat a zkompletovat do jedne zpravy nekolik dilcich sprav z ruznych resortu. Jenze jak uz to tak bejva, tak urednici jsou hovadka a kazdej tu svoji praci poslal v jinym formatu (necekane i v PDF). Bohuzel vyzadat si text v pouzitelne forme neni nekdy uplne mozne, kdo nekdy byl neco resit na uradu, tak urcite chape proc :-). To zviratko to chce v elektronicke forme a to v jednom dokumentu. Tak se snazim ji s tim nak pomoc aby se po vecerech mohla venovat i necemu jinemu ;-)

    Tak to jen tak na vysvetlenou, abych nevypadal jako nakej zlodejicek. Jinak dik za vsechny odpovedi. To pdfimages jak se zdi si neumi poradit s PNG.
    5.4.2006 15:00 Frankie
    Rozbalit Rozbalit vše Re: PDF do textu
    Pdf2txt umí krásně součást XPDF http://www.foolabs.com/xpdf/ - utilitka pdf2text. Funguje pod windows i pod linuxem. Umí správně převádět i češtinu - narozdíl od množství win-shareware programů. XPDF má ještě pdfimages, která z pdf vyhází obrázky. Bohužel ale ne všechny. Myslím, že u vektorových obrázků to nezabírá. PS: K té češtině je potřeba ftp://ftp.foolabs.com/pub/xpdf/xpdf-latin2.tar.gz

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.