abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 19:11 | Komunita

    Společnost JetBrains se stala platinovým sponzorem multiplatformního open source herního enginu Godot. K vývoji her lze používat Rider for Godot. Zdarma pro nekomerční účely.

    Ladislav Hagara | Komentářů: 0
    včera 16:55 | Nová verze

    Byla vydána verze 9.0 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Verze 9.0 je založena na Debianu 13 Trixie. Přehled novinek v poznámkách k vydání a informačním videu.

    Ladislav Hagara | Komentářů: 0
    včera 13:44 | IT novinky

    Operátor O2 dává všem svým zákazníkům s mobilními službami poukaz v hodnotě 300 Kč na nákup telefonu nebo příslušenství jako omluvu za pondělní zhoršenou dostupnost služeb.

    Ladislav Hagara | Komentářů: 10
    včera 04:00 | Nová verze

    Společnost NVIDIA vydala verzi 13.0 toolkitu CUDA (Wikipedie) umožňujícího vývoj aplikací běžících na jejich grafických kartách. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    4.8. 04:22 | IT novinky

    Byly vyhlášeni vítězové a zveřejněny vítězné zdrojové kódy (YouTube, GitHub) již 28. ročníku soutěže International Obfuscated C Code Contest (IOCCC), tj. soutěže o nejnepřehlednější (nejobfuskovanější) zdrojový kód v jazyce C.

    Ladislav Hagara | Komentářů: 9
    3.8. 14:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za červenec (YouTube).

    Ladislav Hagara | Komentářů: 0
    3.8. 01:11 | Pozvánky

    Konečně se ochladilo, možná i díky tomu přestaly na chvíli padat rakety jako přezrálé hrušky, díky čemuž se na Virtuální Bastlírně dostane i na jiná, přízemnější témata. Pokud si chcete jako každý měsíc popovídat s dalšími bastlíři, techniky, vědci a profesory u virtuálního pokecu u piva, Virtuální Bastlírna je tu pro Vás.

    Ještě před ochlazením se drát na vedení V411 roztáhl o 17 metrů (přesné číslo není známé, ale drát nepřežil) a způsobil tak… více »
    bkralik | Komentářů: 3
    2.8. 23:44 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

    Ladislav Hagara | Komentářů: 0
    1.8. 15:44 | Nová verze

    PixiEditor byl vydán ve verzi 2.0. Jedná se o multiplatformní univerzální all-in-one 2D grafický editor. Zvládne rastrovou i vektorovou grafiku, pixel art, k tomu animace a efekty pomocí uzlového grafu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí GNU LGPL 3.0.

    Ladislav Hagara | Komentářů: 2
    1.8. 13:22 | Nová verze

    Byly představeny novinky v Raspberry Pi Connect for Organisations. Vylepšen byl protokol auditu pro lepší zabezpečení. Raspberry Pi Connect je oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče. Verze pro organizace je placená. Cena je 0,50 dolaru za zařízení za měsíc.

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (28%)
     (29%)
     (5%)
     (7%)
     (4%)
     (1%)
     (2%)
     (24%)
    Celkem 217 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Mistral OCR

    Společnost Mistral AI představila Mistral OCR, tj. svůj AI model a API pro OCR (optické rozpoznávání znaků) a převod PDF do Markdown.

    7.3. 18:33 | Ladislav Hagara | IT novinky


    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    8.3. 16:42 ~
    Rozbalit Rozbalit vše Re: Mistral OCR
    Jo protoze sen kazdyho OCRkare je jebat vsechno do cloudu :-) Mysleli to dobre a dopadlo to jako obvykle.
    8.3. 22:46 Milan Vančura | skóre: 2
    Rozbalit Rozbalit vše Re: Mistral OCR
    Také jsem si říkal, že to vypadá jako online služba, ale je to jen trochu zmatený popis, kde sloučili dvě věci dohromady. Ve skutečnosti nabízejí mnoho různých modelů optimalizovaných různým způsobem a také se lišící licencí. A všechny open-source modely jdou stáhnout a používat lokálně, navíc vyladit např. na vlastní konkrétní typy dokumentů. Jako příklad uvádím dvě citace z uvedení modelu Mistral Small 3:
    Local inference: Particularly beneficial for hobbyists and organizations handling sensitive or proprietary information. When quantized, Mistral Small 3 can be run privately on a single RTX 4090 or a Macbook with 32GB RAM.

    Open-source models at Mistral

    We’re renewing our commitment to using Apache 2.0 license for our general purpose models, as we progressively move away from MRL-licensed models. As with Mistral Small 3, model weights will be available to download and deploy locally, and free to modify and use in any capacity.
    10.3. 10:23 ..... Izak ..... | skóre: 14
    Rozbalit Rozbalit vše Re: Mistral OCR
    Super, mam Mac mini pro s 64GB RAM - ale LM_Studio mi rika, ze max pro GPU neumi 60GB, ale 48GB - coz je porad OK
    9.3. 08:39 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: Mistral OCR
    Keď si spomeniem že ku niektorým skenerom sa dodával OCR software schopný naskenovať dokument do štrukturovaného textu (aj s detekciou obrázkov a tabuliek) už pred cca 2O rokmi, tak vidím v používaní buzzwordu AI pokrok. Podobne ako keď sa mi voľajaký SW učil znaky keď som pred vyše 5 rokmi riešil automatický prepis bitmapových titulkov z DVD Video (no ten mal trošku problémy s lignatúrami ako sú napr. et, fi). Tiež si zabudol dať do názvu AI, a tak sa o ňom široká laická verejnosť nedozvedela.
    9.3. 14:09 Mendoza
    Rozbalit Rozbalit vše Re: Mistral OCR
    Nevim, jak kvalitni je ocr s pouzitim ai, ale leta jsem pouzival Abby Finereader nebo Omnipage a vzdycky byla potreba, zvlast u slozitejsich dokumentu, spousta naslednych uprav. Vim, ze ebookari maji i docela vychytana makra na ty nejhorsi veci. Takze ano, slo to, ale zazrak to nikdy nebyl.
    regine2 avatar 9.3. 17:09 regine2 | skóre: 14
    Rozbalit Rozbalit vše Re: Mistral OCR

    Abby Finereader byl a je stále asi nejlepší (na češtinu). Též jsem ho dostal a stále užívám se skenerem. Problém s následnými úpravami bych neviděl v programech na OCR, ale v nejednoznačnosti (nedefinování) souboru pro dokumenty. I takový MS Word je slepenec.

    Dokud nepřiletí mimozemšťané, všechno už jaksi bylo.
    10.3. 10:42 ..... Izak ..... | skóre: 14
    Rozbalit Rozbalit vše Re: Mistral OCR
    Vsak OCR je ve skutecnosti AI, rozpoznava znaky - ale pocitalo se to jen na CPU a muselo to byt rychle, urcite to projel i nejakym slovnikem - ale na textovou analyzu je moderni AI pro GPU mnohem lepsi- umi tak opravovat chyby. Pravdou je, ze je to dost neoptimalizobvane, kdy na to potrebuje tak silene zdroje ;-) - asi by to slo udelat lepe - ale oni jsou lini, udelali koncept, ze na osucasnou AI implementovali OCR - podle me to jeste vyladi - kdyz totiz OCR neco prevde, nadela tam chyby, coz nevadi, nebot pak to projde analyzou a opravi - mozna to nekdy i zmrvi, zvlaste u basnicek, nebo nejakych literarnich del, kde si hraji se slovy, co neexistuji
    xkucf03 avatar 10.3. 11:18 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Mistral OCR - AI a generování chyb
    umi tak opravovat chyby
    Nebo do textu zanášet nové a vymýšlet si, co tam není…

    (tím neříkám, že je to úplně k ničemu, ale obezřetnost je na místě)
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    10.3. 11:59 ..... Izak ..... | skóre: 14
    Rozbalit Rozbalit vše Re: Mistral OCR - AI a generování chyb
    Treba upravovat historicke udalosti a tak ;-)
    xkucf03 avatar 9.3. 14:17 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Mistral OCR, Tesseract, AI
    AI je i klasický Tesseract, akorát pochází z doby, kdy to ještě nebyla taková móda a necpala se ta zkratka všude.
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    9.3. 21:56 @
    Rozbalit Rozbalit vše Re: Mistral OCR, Tesseract, AI
    jasne mistre, mas prehled, az na to, ze Tesseract zrovna pouziva neco, cemu se da rikat "AI", od verze 4, ktera vysla kdy, no schvalne, zjisti si sam... ze ti to nevoni je jasny, jak by mohlo, kdyz je na tom tolik veci, co se da hejtit - ze ti ten hejt ale pomaha se dopracovat k necemu, co fakt dava smysl... vzdyt se roky nikam nehejbes :-D
    9.3. 22:11 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: Mistral OCR, Tesseract, AI
    Až na to že AI znamená SW schopný sa niečo sám učiť, a to existovalo už v minulom tisícročí. Bez ohľadu na to, či ti to niekto povedal na hodine počítačových dejín.
    xkucf03 avatar 10.3. 07:37 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Mistral OCR, Tesseract, AI
    Vždyť taky ta v4 (LSTM) je starší než současná módní vlna, kdy se zkratka "AI" cpe pro jistotu do všeho. I samotná AI je tu o desítky let déle, než současný zájem veřejnosti a investorů.

    Mistral OCR vyzkouším a jestli bude funkčně lepší a licenčně aspoň stejný jako ten Tesseract, tak ho rád budu používat.
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

    Založit nové vláknoNahoru


    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.