abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 16:33 | Zajímavý software

    Sniffnet je multiplatformní aplikace pro sledování internetového provozu. Ke stažení pro Windows, macOS i Linux. Jedná se o open source software. Zdrojové kódy v programovacím jazyce Rust jsou k dispozici na GitHubu. Vývoj je finančně podporován NLnet Foundation.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Nová verze

    Byl vydán Debian Installer Trixie RC 2, tj. druhá RC verze instalátoru Debianu 13 s kódovým názvem Trixie.

    Ladislav Hagara | Komentářů: 0
    včera 03:33 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za červen (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 02:33 | Nová verze

    Libreboot (Wikipedie) – svobodný firmware nahrazující proprietární BIOSy, distribuce Corebootu s pravidly pro proprietární bloby – byl vydán ve verzi 25.06 "Luminous Lemon". Přidána byla podpora desek Acer Q45T-AM a Dell Precision T1700 SFF a MT. Současně byl ve verzi 25.06 "Onerous Olive" vydán také Canoeboot, tj. fork Librebootu s ještě přísnějšími pravidly.

    Ladislav Hagara | Komentářů: 0
    včera 01:33 | Komunita

    Licence GNU GPLv3 o víkendu oslavila 18 let. Oficiálně vyšla 29. června 2007. Při té příležitosti Richard E. Fontana a Bradley M. Kuhn restartovali, oživili a znovu spustili projekt Copyleft-Next s cílem prodiskutovat a navrhnout novou licenci.

    Ladislav Hagara | Komentářů: 0
    2.7. 16:55 | Nová verze

    Svobodný nemocniční informační systém GNU Health Hospital Information System (HIS) (Wikipedie) byl vydán ve verzi 5.0 (Mastodon).

    Ladislav Hagara | Komentářů: 0
    2.7. 16:22 | Komunita

    Open source mapová a navigační aplikace OsmAnd (OpenStreetMap Automated Navigation Directions, Wikipedie, GitHub) oslavila 15 let.

    Ladislav Hagara | Komentářů: 1
    2.7. 11:55 | Zajímavý software

    Vývojář Spytihněv, autor počítačové hry Hrot (Wikipedie, ProtonDB), pracuje na nové hře Brno Transit. Jedná se o příběhový psychologický horor o strojvedoucím v zácviku, uvězněném v nejzatuchlejším metru východně od všeho, na čem záleží. Vydání je plánováno na čtvrté čtvrtletí letošního roku.

    Ladislav Hagara | Komentářů: 38
    1.7. 18:22 | IT novinky

    V uplynulých dnech byla v depu Českých drah v Brně-Maloměřicích úspěšně dokončena zástavba speciální antény satelitního internetu Starlink od společnosti SpaceX do jednotky InterPanter 660 004 Českých drah. Zástavbu provedla Škoda Group. Cestující se s InterPanterem, vybaveným vysokorychlostním satelitním internetem, setkají například na linkách Svitava Brno – Česká Třebová – Praha nebo Moravan Brno – Břeclav – Přerov – Olomouc.

    Ladislav Hagara | Komentářů: 21
    1.7. 13:11 | Nová verze

    Byla vydána nová verze 8.7.0 správce sbírky fotografií digiKam (Wikipedie). Přehled novinek i s náhledy v oficiálním oznámení (NEWS). Nejnovější digiKam je ke stažení také jako balíček ve formátu AppImage. Stačí jej stáhnout, nastavit právo ke spuštění a spustit.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (28%)
     (7%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 347 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník
    Štítky: není přiřazen žádný štítek


    Vložit další komentář
    progdan avatar 22.8.2008 01:01 progdan | skóre: 34 | blog: Archař | Teplice/Brno
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Existuje napriklad programek PDF2HTML (jasny ze idealni by bylo pdf2txt, ale nic takovyho sem neobjevil kdyz sem pred par mesici resil podobny problem)...z toho HTML pak uz jen staci zkopirovat slova do obycejneho textaku, zaindexovat to uz by pak nemel bejt problem
    Collecting data is only the first step toward wisdom, but sharing data is the first step toward the community.
    bazil avatar 22.8.2008 01:28 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    hmm řešení zajímavé, jen si nemyslím, že by potom seděly stránky, když HTML žádné v podstatě nemá
    22.8.2008 01:15 kralyk z abclinuxu | skóre: 29 | blog:
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Nevím jesi chápu přesně vo co se snažíš a jak, ale doporučuju něco menšího napsat v nějakém tom jazyce, hodí se např. hledat googlem případně kouknout na wiki kde je základní popis formátu.

    Nebo jsem to špatně pochopil a máš tu A4ku fyzicky? V takovém případě bych radil podívat se po OCR softwaru.
    bazil avatar 22.8.2008 01:28 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    jo ta A4ka je fyzicky ... ty slova z A4ky opíšu klidně ručně, ale nechcu každé slovo ručně hledat v celém dokumentu a pak psát, kde všude se vyskytuje ...
    22.8.2008 02:07 Ketling | skóre: 8
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    pdftotext - Portable Document Format (PDF) to text converter.

    No a potom na to pustiť nejaký skript.
    otula avatar 22.8.2008 08:13 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Narazil jsem na Zilverine, možná pomůže (nevím, co přesně dělá, ale píše se tam o indexování pdf)
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    bazil avatar 22.8.2008 08:43 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    jo ale tady se indexací myslí vyhledávání ...
    22.8.2008 09:46 Zdeněk Burda | skóre: 61 | blog: Zdendův blog | Praha
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Rozlož pdf na stránky, převeď je do textu. Pak už to skriptíkem dáš dohromady.
    -- Nezdar není hanbou, hanbou je strach z pokusu.
    bazil avatar 22.8.2008 10:05 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    hmmm to zní dobře, jen jak to PDF mám rozkopat na stránky?
    22.8.2008 10:11 klingger | skóre: 18
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Napríklad pdftk to vie.
    xsubway avatar 22.8.2008 10:30 xsubway | skóre: 13 | blog: litera_scripta_manet
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    pro konverzi PDF na text lze pouzit pdftotext ... v textu je vlozen page-break symbol ^L ;) ... dalsi namety: How to Index Anything ;)
    bazil avatar 22.8.2008 10:32 bazil | skóre: 33 | blog: sluje | Miroslav
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    aaaha, díky, teď už to pude nějak oskriptovat ;-)
    Daniel Kvasnička ml. avatar 22.8.2008 13:46 Daniel Kvasnička ml. | skóre: 52 | blog: The Joys and Sorrows of Being an IT Freak | Ostrava
    Rozbalit Rozbalit vše Re: Vytvoření fulltext indexu v PDF - dotaz
    Co tohle? http://www.zotero.org/documentation/pdf_fulltext_indexing
    FSF: “screw you for not wanting the stuff we produce”, People: “screw you for not producing the stuff we want."

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.