abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:22 | IT novinky

    Společnost OpenAI rozšířila své API o nové audio modely. Nový model pro převod textu na řeč (text-to-speech model) lze bez přihlašování vyzkoušet na stránce OpenAI.fm.

    Ladislav Hagara | Komentářů: 0
    včera 21:33 | Zajímavý článek

    Příspěvek Bezpečnost paměti pro webové fonty na blogu Chrome pro vývojáře rozebírá, proč se pro zpracování webových fontů v Chrome místo FreeType nově používá v Rustu napsaná Skrifa z Fontations.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Komunita

    V pátek 21. a v sobotu 22. března proběhnou Arduino Days 2025, tj. každoroční „narozeninová oslava“ platformy Arduino. Na programu je řada zajímavých přednášek. Sledovat je bude možné na YouTube. Zúčastnit se lze i lokálních akcí. V sobotu v Praze na Matfyzu.

    Ladislav Hagara | Komentářů: 0
    včera 11:00 | Pozvánky

    Komunitná konferencia Bratislava OpenCamp, ktorá sa uskutoční už o tri týždne 5. 4. 2025 na FIIT STU pozná svoj program – návštevníkom ponúkne 3 paralelné behy prednášok a workshopov na rôzne témy týkajúce sa otvoreného softvéru či otvorených technológií.

    Ladislav Hagara | Komentářů: 0
    včera 05:11 | Zajímavý článek

    Časopis MagPi od nakladatelství Raspberry Pi se s číslem 151 přejmenoval na Raspberry Pi Official Magazine. I pod novým názvem zůstává nadále ve formátu pdf zdarma ke čtení.

    Ladislav Hagara | Komentářů: 0
    včera 01:55 | IT novinky

    Japonská SoftBank Group kupuje firmu Ampere Computing za 6,5 miliardy dolarů. Ampere Computing vyrábí 32-128jádrové procesory Ampere Altra a 192jádrové procesory AmpereOne.

    Ladislav Hagara | Komentářů: 10
    včera 01:11 | Nová verze

    Byla vydána (𝕏) nová verze 2025.1a linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek v oficiálním oznámení na blogu.

    Ladislav Hagara | Komentářů: 0
    19.3. 20:55 | Nová verze

    Po půl roce vývoje od vydání verze 47 bylo vydáno GNOME 48 s kódovým názvem Bengaluru. Přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře. Vypíchnout lze počáteční podporu HDR, nová výchozí písma Adwaita Sans a Adwaita Mono, přehrávač zvukových souborů Decibely, Pohodu v Nastavení (Digital Wellbeing), …

    Ladislav Hagara | Komentářů: 7
    19.3. 17:33 | Pozvánky

    Engineering Open House v Red Hatu v Brně proběhne v pondělí 31. března [Facebook].

    Ladislav Hagara | Komentářů: 0
    19.3. 13:00 | Nová verze

    Byla vydána nová stabilní verze 7.2 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 134. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    Jaké je vaše preferované prostředí?
     (27%)
     (1%)
     (1%)
     (2%)
     (1%)
     (2%)
     (64%)
     (2%)
    Celkem 183 hlasů
     Komentářů: 5, poslední 13.3. 11:45
    Rozcestník

    Dotaz: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu

    10.9.2015 10:01 Laco
    Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Přečteno: 335×
    Dobry den,
    mam adresar s niekolkymi podadresarmi s asi 6000 PDF subormi. Potrebujem nasledovne riesenie na vyhladavaci web framework:

    - rychle vyhladavanie v nazvoch PDF suborov
    - rychle vyhladavanie v samotnych PDF suboroch
    - vsetko vyhradne cez web rozhranie

    viete mi poradit nejake hotove riesenie, popr. ako na tento problem ist ? vytvorit si databazu (a pravidelne ju aktualizovat) nazvov aj obsahov dokumentov a hladat v nej alebo hladat zakazdym vsetky subory a ich obsah ?

    Dakujem

    Odpovědi

    10.9.2015 17:19 DarkKnight | skóre: 26
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Solr?
    Jendа avatar 11.9.2015 00:14 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Používám recoll + https://github.com/koniu/recoll-webui. Asi neumí separátně názvy, šlo by dohackovat přes locate.
    14.9.2015 21:29 R
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Ten recoll vyzera dobre - nikdy som sa o toto nezaujimal, tak som ani nevedel, ze take nieco existuje.
    14.9.2015 20:48 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    PDF je na h...o. Zkonvertuj to do DjVu a máš po problému.
    Jendа avatar 14.9.2015 21:54 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Jak přesně se ten problém konverzí vyřeší? Někde se samo od sebe objeví webové rozhraní, které bude dělat přesně to, co tazatel chce?
    15.9.2015 07:35 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Může použít MediaWiki, tak jako já a nebo si to může napsat sám. Podstatné je, že pokud ty pdf soubory nemají textovou vrstvu, tak je může po konverzi prohnat přes ocr a tím ji získat. Velice snadno si pak může tyhle data vytáhnout do databáze a s jejich pomocí vyhledávat i v rámci těch původních PDF souborů, protože ty se nijak nezmění. Zobrazená stránka v Djvu bude mít stejné pořadí i rozměr jako u PDF. Akorát ten soubor bude řádově menší. U DjVu není problém pracovat a fulltextově vyhledávat i u souboru co má 1000 stran. Zkuste to u PDF. Zešílíte.
    15.9.2015 07:41 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Ještě jinak. Znáte server http://www.archive.org ? Schválně se u některého z uložených dokumentů koukněte v jakých je uložených formátech. Prakticky každý z nich je k dispozici i v DjVu a ten důvod proč je přesně takový, jako řeší tazatel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.