abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:11 | Nová verze

    Čínský startup Kimi představil open-source model umělé inteligence Kimi K2.5. Nová verze pracuje s textem i obrázky a poskytuje 'paradigma samosměřovaného roje agentů' pro rychlejší vykonávání úkolů. Kimi zdůrazňuje vylepšenou schopnost modelu vytvářet zdrojové kódy přímo z přirozeného jazyka. Natrénovaný model je dostupný na Hugging Face, trénovací skripty však ne. Model má 1 T (bilion) parametrů, 32 B (miliard) aktivních.

    NUKE GAZA! 🎆 | Komentářů: 0
    dnes 09:00 | IT novinky

    V Raspberry Pi OS lze nově snadno povolit USB Gadget Mode a díky balíčku rpi-usb-gadget (CDC-ECM/RNDIS) mít možnost se k Raspberry Pi připojovat přes USB kabel bez nutnosti konfigurování Wi-Fi nebo Ethernetu. K podporovaným Raspberry Pi připojeným do USB portu podporujícího OTG.

    Ladislav Hagara | Komentářů: 0
    dnes 03:33 | Komunita

    Konference Installfest 2026 proběhne o víkendu 28. a 29. března v budově FELu na Karlově náměstí v Praze. Přihlásit přednášku nebo workshop týkající se Linuxu, otevřených technologií, sítí, bezpečnosti, vývoje, programování a podobně lze do 18. února 0:15.

    Ladislav Hagara | Komentářů: 0
    dnes 03:22 | Komunita

    Fedora Flock 2026, tj. konference pro přispěvatele a příznivce Fedory, bude opět v Praze. Proběhne od 14. do 16. června. Na Flock navazuje DevConf.CZ 2026, který se uskuteční 18. a 19. června v Brně. Organizátoři konferencí hledají přednášející, vyhlásili Call for Proposals (CfP).

    Ladislav Hagara | Komentářů: 0
    dnes 03:11 | Zajímavý software

    Z80-μLM je jazykový model 'konverzační umělé inteligence' optimalizovaný pro běh na 8-bitovém 4Mhz procesoru Z80 s 64kB RAM, technologii z roku 1976. Model používá 2-bitovou kvantizaci a trigramové hashování do 128 položek, což umožňuje zpracování textu i při velmi omezené paměti. Natrénovaný model se vejde do binárního souboru velkého pouhých 40 KB. Tento jazykový model patrně neprojde Turingovým testem 😅.

    NUKE GAZA! 🎆 | Komentářů: 2
    včera 17:44 | IT novinky

    Digitální a informační agentura (DIA) na přelomu roku dokončila rozsáhlou modernizaci hardwarové infrastruktury základních registrů. Projekt za 236 milionů korun by měl zabránit výpadkům digitálních služeb státu, tak jako při loňských parlamentních volbách. Základní registry, tedy Registr práv a povinností (RPP), Informační systém základních registrů (ISZR) a Registr obyvatel (ROB), jsou jedním z pilířů veřejné správy. Denně

    … více »
    Ladislav Hagara | Komentářů: 5
    včera 17:33 | IT novinky

    Evropská komise (EK) zahájila nové vyšetřování americké internetové platformy 𝕏 miliardáře Elona Muska, a to podle unijního nařízení o digitálních službách (DSA). Vyšetřování souvisí se skandálem, kdy chatbot s umělou inteligencí (AI) Grok na žádost uživatelů na síti 𝕏 generoval sexualizované fotografie žen a dětí. Komise o tom dnes informovala ve svém sdělení. Americký podnik je podezřelý, že řádně neposoudil a nezmírnil rizika spojená se zavedením své umělé inteligence na on-line platformě.

    Ladislav Hagara | Komentářů: 10
    včera 15:11 | Komunita

    Bratislava OpenCamp pokračuje vo svojej tradícii a fanúšikovia otvorených technológií sa môžu tešiť na 4. ročník, ktorý sa uskutoční 25. 4. 2026 na FIIT STU v Bratislave. V súčasnosti prebieha prihlasovanie prednášok a workshopov – ak máte nápad, projekt, myšlienku, o ktoré sa chcete podeliť s komunitou, OpenCamp je správne miesto pre vás.

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | IT novinky

    Krádež není inovace (Stealing Isn't Innovation). Koalice umělců, spisovatelů a tvůrců protestuje proti používání autorsky chráněných děl velkými technologickými společnostmi pro trénování AI systémů bez povolení či kompenzace.

    Ladislav Hagara | Komentářů: 20
    včera 12:22 | IT novinky

    Stát, potažmo ministerstvo vnitra plánuje zřízení nového, neveřejného virtuálního operátora, který by byl primárně určený na zajištěni kritické infrastruktury státu. Cílem je zajistit udržitelné, bezpečné, mobilní, vysokorychlostní datové a hlasové služby umožňující přístup ke kritickým aplikacím IZS a krizového řízení.

    karkar | Komentářů: 14
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (5%)
     (0%)
     (10%)
     (22%)
     (3%)
     (5%)
     (2%)
     (11%)
     (33%)
    Celkem 637 hlasů
     Komentářů: 17, poslední 22.1. 15:24
    Rozcestník

    Převod PDF na text

    6.1.2005 21:17 | Přečteno: 12981× | Software & hardware | poslední úprava: 3.5.2005 23:00

    PDF od Novellu

    Při zadání podobného dotazu jako je titulek do Google vám vypadne velké množství odkazů na různé programy tuto akci umožnující (prý i se 100% kvalitou !) ale z linuxových se objeví pouze pdf2ps, pdftotext a ps2ascii, případně jejich různé kombinace.

    Tak tedy k tomu, proč jsem tento zápisek stvořil. Včera pozdě večer mi přišel do schránky mail s názvem "Happy 2005 from Novell Customer Communities: Linux Quick Reference Guide", od kterého jsem čekal odkaz na objedávací formulář nějaké pěkné bichle. Nebylo tomu ovšem tak a vevnitř na mně vykoukl odkaz na takové reklamní PDF se základními příkazy do Linuxu, které se ovšem (zvláště začínajícím uživatelům) mohou hodit.

    Byl tu ovšem problém právě v té reklamnosti - polovinu stránky A4 tvoří, jak můžete vidět na obrázku, příkazy a druhou polovinu zelená plocha, což se cartridgi v mé tiskárně náramně zamlouvá... To abych si po vytištění třináctistránkové příručky šel koupit novou.

    Tak jsem začal hledat řešení pro konverzi do textového souboru, které se po vyzkoušení pdftotext objevilo v podobě programu pdf2ps. Pdftotext mi při pokusu o konverzi prostě nahlásil, že dokument je chráněný a nejde z něj text vykopírovat. S tím jsem se ale nehodlal smířit už proto, že když ten text vidím, tak přece musí v tom PDF někde být...

    Podle manuálové stránky je použití ps2ascii jednoduché:

    POUŽITÍ
           ps2ascii [ vstup.ps [ výstup.txt ] ]
           ps2ascii vstup.pdf [ výstup.txt ]

    Zájemci si mohou stáhnout zmíněné PDF nebo jeho textovou variantu.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    3.2.2005 20:09 ktx
    Rozbalit Rozbalit vše funguje
    takze pdf2ascii funguje aj pri chranenych pdfkach, dobre vediet :P
    6.2.2005 22:06 medulin | skóre: 31 | blog: medulin | ČR
    Rozbalit Rozbalit vše nefunguje
    [tomas@tomas otazky ke zkousce]$ ps2ascii otazky-vypracovane.pdf [ otazky.txt ]
    ESP Ghostscript 7.07.2: Unrecoverable error, exit code 1
    me to nejde :-( delam neco spatne?

    [tomas@tomas otazky ke zkousce]$ pdfinfo otazky-vypracovane.pdf
    Title: Microsoft Word - otázky.doc
    Author: ... Creator: ADOBEPS4.DRV Version 4.50
    Producer: Acrobat Distiller 5.0.5 (Windows)
    CreationDate: Sun Jan 2 11:13:48 2005
    ModDate: Sun Jan 2 11:13:48 2005
    Tagged: no
    Pages: 30
    Encrypted: no
    Page size: 595 x 842 pts (A4)
    File size: 1217313 bytes
    Optimized: yes
    PDF version: 1.3

    6.2.2005 22:17 Jan Grmela | skóre: 45 | blog: Kilo šťávy z lachtana | Brno
    Rozbalit Rozbalit vše Re: nefunguje
    No nejdriv bych asi zkusil nejakou novou verzi GS, treba z CVS nebo kontaktoval vyvojare.
    9.3.2012 17:59 VelkyBubak
    Rozbalit Rozbalit vše Re: nefunguje
    Vím, že na tohle odpovídám s křížkem po funuse, ale to bude tím, že autor použil nejdříve

    pdf2ps

    a teprve poté

    ps2ascii

    tedy pro tento případ:

    pdf2ps otazky-vypracovane.pdf [ otazky.ps ]

    ps2ascii otazky.ps [ otazky.txt ]

    15.3.2005 22:31 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
    Rozbalit Rozbalit vše pdftotext
    Zasadni aplikaci pro prevod pdf do textu je
    pdftotext
    ktery je soucasti xpdf. Umi i diakritiku. Nefunguje 100%, ale nic lepsiho zdarma pro linux asi neexistuje.
    -- OldFrog
    15.3.2005 22:33 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
    Rozbalit Rozbalit vše Re: pdftotext
    A jednoucelovy orez a tisk bych resil prevodem do bitmapy a naslednym tiskem. Lepsi vysledek by umoznilo pouziti pdfTeXu a balicku pdfpages.
    -- OldFrog
    regine2 avatar 15.4.2012 14:49 regine2 | skóre: 14
    Rozbalit Rozbalit vše Re: Převod PDF na text

    Protože na ŽIVĚ cenzor tento můj dobrý odkaz dnes 15.4.2012 nepříčetně maže (vím není zde normálně místo pro MS-produkty, ale zkuste ve Wine)

    Wondershare PDF Editor dočasně BETA free - a mě funguje - stahujte:

    první odkaz

    pdf-editor druhý odkaz
    Dokud nepřiletí mimozemšťané, všechno už jaksi bylo.
    28.11.2017 21:50 monina
    Rozbalit Rozbalit vše Re: Převod PDF na text

    pro všechny, kdo jsem přijdou a hledají jak převést pdf do wordu - tedy textu

    http://otevrito.cz/o/jak-prevest-pdf-do-word-doc-docx

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.