abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 16:44 | Nová verze

    Svobodný multiplatformní herní engine Bevy napsaný v Rustu byl vydán ve verzi 0.18. Díky 174 přispěvatelům.

    Ladislav Hagara | Komentářů: 2
    včera 15:11 | IT novinky

    Miliardy korun na digitalizaci služeb státu nestačily. Stát do ní v letech 2020 až 2024 vložil víc než 50 miliard korun, ale původní cíl se nepodařilo splnit. Od loňského února měly být služby státu plně digitalizované a občané měli mít právo komunikovat se státem digitálně. Do tohoto data se povedlo plně digitalizovat 18 procent agendových služeb státu. Dnes to uvedl Nejvyšší kontrolní úřad (NKÚ) v souhrnné zprávě o stavu digitalizace v Česku. Zpráva vychází z výsledků víc než 50 kontrol, které NKÚ v posledních pěti letech v tomto oboru uskutečnil.

    Ladislav Hagara | Komentářů: 7
    včera 13:55 | IT novinky

    Nadace Wikimedia, která je provozovatelem internetové encyklopedie Wikipedia, oznámila u příležitosti 25. výročí vzniku encyklopedie nové licenční dohody s firmami vyvíjejícími umělou inteligenci (AI). Mezi partnery encyklopedie tak nově patří Microsoft, Amazon a Meta Platforms, ale také start-up Perplexity a francouzská společnost Mistral AI. Wikimedia má podobnou dohodu od roku 2022 také se společností Google ze skupiny

    … více »
    Ladislav Hagara | Komentářů: 0
    včera 02:22 | Nová verze

    D7VK byl vydán ve verzi 1.2. Jedná se o fork DXVK implementující překlad volání Direct3D 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 0
    včera 02:00 | Nová verze

    Byla vydána verze 12.0.0 knihovny libvirt (Wikipedie) zastřešující různé virtualizační technologie a vytvářející jednotné rozhraní pro správu virtuálních strojů. Současně byl ve verzi 12.0.0 vydán související modul pro Python libvirt-python. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    15.1. 19:22 | Humor

    CreepyLink.com je nový zkracovač URL adres, 'díky kterému budou vaše odkazy vypadat tak podezřele, jak je to jen možné'. Například odkaz na abclinuxu.cz tento zkracovač převádí do podoby 'https://netflix.web-safe.link/logger_8oIlgs_free_money.php'. Dle prohlášení autora je CreepyLink alternativou ke zkracovači ShadyURL (repozitář na githubu), který dnes již bohužel není v provozu.

    NUKE GAZA! 🎆 | Komentářů: 3
    15.1. 12:33 | IT novinky

    Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.

    Ladislav Hagara | Komentářů: 3
    15.1. 12:11 | Komunita

    Wikipedie slaví 25. výročí svého založení. Vznikla 15. ledna 2001 jako doplňkový projekt k dnes již neexistující encyklopedii Nupedia. Doména wikipedia.org byla zaregistrována 12. ledna 2001. Zítra proběhne v Praze Večer svobodné kultury, který pořádá spolek Wikimedia ČR.

    Ladislav Hagara | Komentářů: 1
    15.1. 04:44 | Nová verze

    Po více než dvou letech od vydání předchozí verze 2.12 byla vydána nová stabilní verze 2.14 systémového zavaděče GNU GRUB (GRand Unified Bootloader, Wikipedie). Přehled novinek v souboru NEWS a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 2
    15.1. 02:22 | Nová verze

    Google Chrome 144 byl prohlášen za stabilní. Nejnovější stabilní verze 144.0.7559.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 10 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře (YouTube).

    Ladislav Hagara | Komentářů: 4
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (5%)
     (0%)
     (9%)
     (19%)
     (3%)
     (6%)
     (3%)
     (11%)
     (42%)
    Celkem 462 hlasů
     Komentářů: 12, poslední 14.1. 21:12
    Rozcestník
    Štítky: není přiřazen žádný štítek


    Vložit další komentář
    26.9.2023 13:54 Tom
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Pomerne zavazne info az to nekdo ma na starsim servru: Dropped support 32-bit Windows and Linux. You must use a 64-bit operating system.
    26.9.2023 19:28 jowa868
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    On v dnešní době ještě někdo používá 32-bit Intel? :O
    26.9.2023 20:43 Jin
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    A to jej mam vyhodit? Slape jak hodinky a po upgrade na SSD chytil druhy dech. IBM xSeries 305 s Pentium4 a frci tam skolni phpBB a nejaky apache :)
    26.9.2023 21:03 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Ak má škola elektriku zdarma, ...
    26.9.2023 22:33 Jin
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Ma to tusim 200W zdroj a povoleny sleep s WOL. A v tom racku je podobnych kousku mnohem vic, holt sme elekrotechnicka skola toz si muzem dovolit i muzeum :)
    27.9.2023 07:01 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    A to s tým rackom vykurujete školu?
    27.9.2023 18:31 Jin
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Mam dojem ze prumerna paranska masina s dvema GPU a 800W zdrojem zere vic nez ten rack. Navic kdyz do takove svatyne zavedes linuxacku tak se ji spusti prirozene reflexy, odhazuje podprdu a roztahuje nohy! :-)
    27.9.2023 18:46 paráda
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Takový oslí můstek jak z OCR dojít k radodajné linuxačce, to najdete jen na abclinuxu.cz!
    27.9.2023 19:00 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Obávam sa že 5 rokov starý firemný notebook má viac výpočtového výkonu ako celý rack naložený spomínanými servermi IBM xSeries 305 s Pentium4 a aj menšiu spotrebu ako jediný taký server. Predsa len 533 MHz FSB a 133 MHz DDR PC2100 sú 20 rokov staré vykopávky.

    Čo ale nič nemení na tom, že OCRmyPDF je python nádstavba nad tesseract. Takže na vyjadrení o podpore OCRmyPDF len pre 64bit nezáleží ak python a tesseract ostanú fungovať na 32bit.
    27.9.2023 12:03 B
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Ano, vyhodit.
    27.9.2023 19:40 Kantor
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    A ty víš, že v školství v podstatě neexistuje amortizace nebo morálni zastaralost techniky? Dokud něco šlape tak se prostě nevyhodí dokud nechcípne*. A to takový Meotar chcípá dost neochotně...

    * jo když je to nutný tak na to "náhodou" uklízečka vyleje kýbl a to se pak už musí odepsat z "bezpečnostních" důvodů...
    27.9.2023 20:18 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Kedysi firmy zvykli darovať školstvu odpísanú výpočtovú techniku. Odpisy boli obvykle po cca 2 až 5 rokoch, podľa typu. Pre firmy to bolo lacnejšie ako to dať na "nútenú ekologickú recykláciu", a robili tak rady.

    Bolo by to lepšie ako používať server starší ako sú študenti.
    27.9.2023 22:00 Jin
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    A to myslis, ze nase skola mela prachy na rack s novym IBM? Jasne ze to byl dar a nam skvele slouzi - jako ucebni pomucka, tak jako servry.
    28.9.2023 07:21 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Akože podľa teba školy odkupovali za peniaze darované odpisy z firiem? Z teba bude úspešný podnikateľ, ktorý bude spriaznený z vládou.
    28.9.2023 07:49 Jin
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Cteni s porozumenim neni tvoje silna stranka ze?
    28.9.2023 08:03 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Ale je. Kedysi dokonca existovala na Slovensku možnosť priameho sponzoringu (keď sa dar odpisoval školstvu z daní ktoré firma mala zaplatiť štátu).

    To nič nebráni používať to vykurovacie teleso na zaťažovanie klimatizácie za cenu zvýšených nákladov na energie. Ale na prevod naskenovaných dokumentov je to nehospodárne. A to je dôvod môjho skepticizmu.

    Stále sú 32bit distribúcie ktoré ostanú podporované ešte X rokov aj na prastarom HW. Keby si to spravoval, tak to vieš.
    Max avatar 2.10.2023 10:26 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Eko likvidace je zdarma a bez většího papírování a námahy. Darování je papírování + námaha. Darování tedy sebou kupodivu nese overhead. Každopádně my jedeme dárcovství pro jednu školu a teď se rozjíždí pro druhou. Hlavně vyřazené tablety a počítače.
    Zdar Max
    Měl jsem sen ... :(
    28.9.2023 16:55 bhy | skóre: 36 | blog: bhyblog | brno
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Používáte někdo aktivně Tesseract nebo obecně offline open source OCR na Linuxu? V mém okolí všichni používají více méně bezchybně fungující online webové služby. Myslel jsem, že ty služby používají jako backend to, co mám v distribuci, ale ani náhodou. Z PDF v dobré kvalitě, se kterým online služby neměly problém, jsem nedokázal dostat nic než prázdný výstup (GOCR, Tesseract - zkoušel jsem i 5.x z PPA), popř. trochu rozsypaného čaje (Cuneiform).

    Jsou ty věci už mrtvé a všechno se dělá online, nebo jsem se jen málo snažil? Chápu, že může být potřeba nějaký pre-processing (zvýšení DPI apod.), ale prázdný výstup z PDF, které online služby převedou bez problémů, mi přijde jako dost kontrast.
    28.9.2023 18:32 Dan
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Online jsou dobre tak akorat na anglinu. Ja casto ocrkuji i exotictejsi jazyky a tesseract tam hraje prvni housle. Samozrejme je treba mu dat hint jaky jazyk a stahnout slovnik. No a pak je tu objem. Prohnat 300 megovou knihu online neni vubec jednoduchy a u free sluzeb v podstate nemozny.
    28.9.2023 18:34 RealJ | skóre: 9
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Ja pouzivam tesseract na macos pres homebrew, mesicne tim proleze tak 10tis dokumentu a nejake problemy jsem s tim nepozoroval.
    Jendа avatar 28.9.2023 19:24 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Já Tesseract párkrát použil a naprosto bez problémů. Prázdný výstup spíš zní jako že jsi to měl špatně nastavené. Osobně jsem teda nikdy nepouštěl Tesseract přímo na PDF, ale vyextrahoval jsem z něj bitmapy a pouštěl to na ty. Takhle.
    28.9.2023 20:43 Pdfwarez
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    No a abys z toho nemusel mit navod na celou stranku tak vzniklo ocrmypdf a jednoduchy prikaz co udela vse:

    ocrmypdf -l eng input.pdf output.pdf
    xkucf03 avatar 28.9.2023 21:21 xkucf03 | skóre: 50 | blog: xkucf03
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0 - tesseract
    Je to přibližně na tři řádky, viz můj příklad u nedávné zprávičky.

    Důležitý je ten parametr -l ces (případně eng) tzn. je potřeba použít správný slovník. Funguje to poměrně dobře, i na skeny, takže jestli si chce někdo přidat textovou vrstvu do PDF pro vyhledávání nebo vykopírování částí textu, tak tohle v pohodě jde použít. A není potřeba posílat svoje data někam do cloudu a být závislý na nějakém poskytovateli.
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    Max avatar 2.10.2023 10:30 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    Rozjel jsem on-prem web službu nad OCRMyPDF. Je to kvůli tomu, aby si zaměstnanci mohli nad naskenovanými PDF nahodit textovou vrstvu a mohli vykopírovat data.
    Běží to na upravené verzi OCRmyPDF-web.
    Veřejně dostupné aplikace mají různé politiky a nejsou pro firemní data důvěryhodné.
    Zdar Max
    Měl jsem sen ... :(
    3.10.2023 12:06 bhy | skóre: 36 | blog: bhyblog | brno
    Rozbalit Rozbalit vše Re: OCRmyPDF 15.0.0
    wow, díky, vyzkouším:)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.