abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 11:11 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 161 (pdf).

    Ladislav Hagara | Komentářů: 0
    dnes 10:44 | Nová verze

    Po delší době vývoje vyšla nativní linuxová verze virtuálního bubeníka MT-PowerDrumKit 2 ve formátu VST3. Mezi testovanými hosty jsou Reaper, Ardour, Bitwig a Carla.

    balda | Komentářů: 1
    včera 21:33 | Nová verze

    Desktopové prostředí Budgie bylo vydáno ve verzi 10.10. Dokončena byla migrace z X11 na Wayland. Budgie 10 vstupuje do režimu údržby. Vývoj se přesouvá k Budgie 11. Dlouho se řešilo, v čem bude nové Budgie napsáno. Budgie 10 je postaveno nad GTK 3. Přemýšlelo se také nad přepsáním z GTK do EFL. Budgie 11 bude nakonec postaveno nad Qt 6.

    Ladislav Hagara | Komentářů: 0
    včera 13:00 | Humor

    OpenChaos.dev je 'samovolně se vyvíjející open source projekt' s nedefinovaným cílem. Každý týden mohou lidé hlasovat o návrzích (pull requestech), přičemž vítězný návrh se integruje do kódu projektu (repozitář na GitHubu). Hlasováním je možné změnit téměř vše, včetně tohoto pravidla. Hlasování končí vždy v neděli v 9:00 UTC.

    NUKE GAZA! 🎆 | Komentářů: 3
    včera 03:00 | Nová verze

    Byl vydán Debian 13.3, tj. třetí opravná verze Debianu 13 s kódovým názvem Trixie a Debian 12.13, tj. třináctá opravná verze Debianu 12 s kódovým názvem Bookworm. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 a Debianu 12 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

    Ladislav Hagara | Komentářů: 0
    10.1. 03:00 | Komunita

    Na stránkách Evropské komise, na portálu Podělte se o svůj názor, se lze do 3. února podělit o názor k iniciativě Evropské otevřené digitální ekosystémy řešící přístup EU k otevřenému softwaru.

    Ladislav Hagara | Komentářů: 6
    9.1. 19:44 | Zajímavý software

    Společnost Kagi stojící za stejnojmenným placeným vyhledávačem vydala (𝕏) alfa verzi linuxové verze (flatpak) svého proprietárního webového prohlížeče Orion.

    Ladislav Hagara | Komentářů: 5
    9.1. 19:11 | IT novinky

    Firma Bose se po tlaku uživatelů rozhodla, že otevře API svých chytrých reproduktorů SoundTouch, což umožní pokračovat v jejich používání i po plánovaném ukončení podpory v letošním roce. Pro ovládání také bude stále možné využívat oficiální aplikaci, ale už pouze lokálně bez cloudových služeb. Dokumentace API dostupná zde (soubor PDF).

    NUKE GAZA! 🎆 | Komentářů: 2
    9.1. 14:22 | Zajímavý článek

    Jiří Eischmann se v příspěvku na svém blogu rozepsal o open source AdGuard Home jako domácí ochraně nejen před reklamou. Adguard Home není plnohodnotným DNS resolverem, funguje jako DNS forwarder s možností filtrování. To znamená, že když přijme DNS dotaz, sám na něj neodpoví, ale přepošle ho na vybraný DNS server a odpovědi zpracovává a filtruje dle nastavených pravidel a následně posílá zpět klientům. Dá se tedy používat k blokování reklamy a škodlivých stránek a k rodičovské kontrole na úrovni DNS.

    Ladislav Hagara | Komentářů: 8
    9.1. 03:33 | Zajímavý software

    AI Claude Code od Anthropicu lépe rozumí frameworku Nette, tj. open source frameworku pro tvorbu webových aplikací v PHP. David Grudl napsal plugin Nette pro Claude Code.

    Ladislav Hagara | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (8%)
     (4%)
     (0%)
     (9%)
     (20%)
     (3%)
     (5%)
     (3%)
     (11%)
     (49%)
    Celkem 382 hlasů
     Komentářů: 9, poslední dnes 18:09
    Rozcestník

    Vytvoření fulltext indexu v PDF - dotaz

    22.8.2008 00:22 | Přečteno: 1257× | blbůstky

    Tak se mi tu tak válí jeden hezký PDF soubor. On vlastně není ani tak moc hezký, jako PDF a já v něm potřebuju udělat fulltext index.

    A by toho trápení nebylo málo, tak tu mám asi tak A4ku zadanejch slov, který se maj v tom indexu objevit. Index to má být klasickej. V levo slovo v pravo seznam stránek, na kterejch se vyskytuje. Vcelku jasná vyzuální podoba, ale jak to udělat automaticky? Ručně to určitě psát nechci, nehledě na to, že bych se mohl přehlídnout. Akceptuji jakékoliv řešení (tzn i windows) Díky.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    progdan avatar 22.8.2008 01:01 progdan | skóre: 34 | blog: Archař | Teplice/Brno
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Existuje napriklad programek PDF2HTML (jasny ze idealni by bylo pdf2txt, ale nic takovyho sem neobjevil kdyz sem pred par mesici resil podobny problem)...z toho HTML pak uz jen staci zkopirovat slova do obycejneho textaku, zaindexovat to uz by pak nemel bejt problem
    Collecting data is only the first step toward wisdom, but sharing data is the first step toward the community.
    bazil avatar 22.8.2008 01:28 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    hmm řešení zajímavé, jen si nemyslím, že by potom seděly stránky, když HTML žádné v podstatě nemá
    22.8.2008 01:15 kralyk z abclinuxu | skóre: 29 | blog:
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Nevím jesi chápu přesně vo co se snažíš a jak, ale doporučuju něco menšího napsat v nějakém tom jazyce, hodí se např. hledat googlem případně kouknout na wiki kde je základní popis formátu.

    Nebo jsem to špatně pochopil a máš tu A4ku fyzicky? V takovém případě bych radil podívat se po OCR softwaru.
    bazil avatar 22.8.2008 01:28 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    jo ta A4ka je fyzicky ... ty slova z A4ky opíšu klidně ručně, ale nechcu každé slovo ručně hledat v celém dokumentu a pak psát, kde všude se vyskytuje ...
    22.8.2008 02:07 Ketling | skóre: 8
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    pdftotext - Portable Document Format (PDF) to text converter.

    No a potom na to pustiť nejaký skript.
    otula avatar 22.8.2008 08:13 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Narazil jsem na Zilverine, možná pomůže (nevím, co přesně dělá, ale píše se tam o indexování pdf)
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    bazil avatar 22.8.2008 08:43 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    jo ale tady se indexací myslí vyhledávání ...
    22.8.2008 09:46 Zdeněk Burda | skóre: 61 | blog: Zdendův blog | Praha
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Rozlož pdf na stránky, převeď je do textu. Pak už to skriptíkem dáš dohromady.
    -- Nezdar není hanbou, hanbou je strach z pokusu.
    bazil avatar 22.8.2008 10:05 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    hmmm to zní dobře, jen jak to PDF mám rozkopat na stránky?
    22.8.2008 10:11 klingger | skóre: 18
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Napríklad pdftk to vie.
    xsubway avatar 22.8.2008 10:30 xsubway | skóre: 13 | blog: litera_scripta_manet
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    pro konverzi PDF na text lze pouzit pdftotext ... v textu je vlozen page-break symbol ^L ;) ... dalsi namety: How to Index Anything ;)
    bazil avatar 22.8.2008 10:32 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    aaaha, díky, teď už to pude nějak oskriptovat ;-)
    Daniel Kvasnička ml. avatar 22.8.2008 13:46 Daniel Kvasnička ml. | skóre: 52 | blog: The Joys and Sorrows of Being an IT Freak | Ostrava
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Co tohle? http://www.zotero.org/documentation/pdf_fulltext_indexing
    FSF: “screw you for not wanting the stuff we produce”, People: “screw you for not producing the stuff we want."

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.