abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:55 | Zajímavý projekt

    Společnost Hugging Face ve spolupráci se společností Pollen Robotics představila open source robota Reachy Mini (YouTube). Předobjednat lze lite verzi za 299 dolarů a wireless verzi s Raspberry Pi 5 za 449 dolarů.

    Ladislav Hagara | Komentářů: 4
    11.7. 16:44 | Komunita

    Dnes v 17:30 bude oficiálně vydána open source počítačová hra DOGWALK vytvořena v 3D softwaru Blender a herním enginu Godot. Release party proběhne na YouTube od 17:00.

    Ladislav Hagara | Komentářů: 3
    11.7. 14:55 | Humor

    McDonald's se spojil se společností Paradox a pracovníky nabírá také pomocí AI řešení s virtuální asistentkou Olivii běžící na webu McHire. Ian Carroll a Sam Curry se na toto AI řešení blíže podívali a opravdu je překvapilo, že se mohli přihlásit pomocí jména 123456 a hesla 123456 a získat přístup k údajům o 64 milionech uchazečů o práci.

    Ladislav Hagara | Komentářů: 15
    11.7. 00:11 | Nová verze

    Byla vydána (𝕏) červnová aktualizace aneb nová verze 1.102 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.102 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    10.7. 21:00 | Bezpečnostní upozornění

    Byla vydána nová verze 2.4.64 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 8 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 4
    10.7. 15:22 | Nová verze

    Společnost xAI na síti 𝕏 představila Grok 4, tj. novou verzi svého AI LLM modelu Grok.

    Ladislav Hagara | Komentářů: 12
    10.7. 12:55 | Bezpečnostní upozornění

    Ministerstvo vnitra odhalilo závažný kyberincident v IT systému resortu. Systém, do kterého se dostal útočník bez oprávnění, byl odpojen a nedošlo k odcizení dat [𝕏].

    Ladislav Hagara | Komentářů: 16
    10.7. 11:55 | Humor

    Před rokem byla streamovací služba HBO Max přejmenována na Max. Dle managementu slovo HBO v názvu nebylo důležité. Včera byl Max přejmenován zpět na HBO Max. Kolik milionů dolarů to stálo? 😂

    Ladislav Hagara | Komentářů: 16
    10.7. 02:11 | Nová verze

    Byla vydána nová major verze 8.0.0 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata (Wikipedie). Přehled novinek v oficiálním oznámení a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    10.7. 01:11 | Nová verze

    Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.4. Přehled novinek s náhledy a videi v oznámení na blogu.

    Ladislav Hagara | Komentářů: 1
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (27%)
     (7%)
     (3%)
     (1%)
     (1%)
     (4%)
    Celkem 391 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Dotaz: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu

    10.9.2015 10:01 Laco
    Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Přečteno: 336×
    Dobry den,
    mam adresar s niekolkymi podadresarmi s asi 6000 PDF subormi. Potrebujem nasledovne riesenie na vyhladavaci web framework:

    - rychle vyhladavanie v nazvoch PDF suborov
    - rychle vyhladavanie v samotnych PDF suboroch
    - vsetko vyhradne cez web rozhranie

    viete mi poradit nejake hotove riesenie, popr. ako na tento problem ist ? vytvorit si databazu (a pravidelne ju aktualizovat) nazvov aj obsahov dokumentov a hladat v nej alebo hladat zakazdym vsetky subory a ich obsah ?

    Dakujem

    Odpovědi

    10.9.2015 17:19 DarkKnight | skóre: 26
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Solr?
    Jendа avatar 11.9.2015 00:14 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Používám recoll + https://github.com/koniu/recoll-webui. Asi neumí separátně názvy, šlo by dohackovat přes locate.
    14.9.2015 21:29 R
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Ten recoll vyzera dobre - nikdy som sa o toto nezaujimal, tak som ani nevedel, ze take nieco existuje.
    14.9.2015 20:48 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    PDF je na h...o. Zkonvertuj to do DjVu a máš po problému.
    Jendа avatar 14.9.2015 21:54 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Jak přesně se ten problém konverzí vyřeší? Někde se samo od sebe objeví webové rozhraní, které bude dělat přesně to, co tazatel chce?
    15.9.2015 07:35 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Může použít MediaWiki, tak jako já a nebo si to může napsat sám. Podstatné je, že pokud ty pdf soubory nemají textovou vrstvu, tak je může po konverzi prohnat přes ocr a tím ji získat. Velice snadno si pak může tyhle data vytáhnout do databáze a s jejich pomocí vyhledávat i v rámci těch původních PDF souborů, protože ty se nijak nezmění. Zobrazená stránka v Djvu bude mít stejné pořadí i rozměr jako u PDF. Akorát ten soubor bude řádově menší. U DjVu není problém pracovat a fulltextově vyhledávat i u souboru co má 1000 stran. Zkuste to u PDF. Zešílíte.
    15.9.2015 07:41 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Prehladavanie PDF suborov a ich obsahu cez web aplikaciu
    Ještě jinak. Znáte server http://www.archive.org ? Schválně se u některého z uložených dokumentů koukněte v jakých je uložených formátech. Prakticky každý z nich je k dispozici i v DjVu a ten důvod proč je přesně takový, jako řeší tazatel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.