Portál AbcLinuxu, 12. května 2025 08:05

Dotaz: Fulltextove vyhledavani v PDF dokumentech

27.9.2010 13:26 David | skóre: 21 | Praha
Fulltextove vyhledavani v PDF dokumentech
Přečteno: 326×
Odpovědět | Admin
Ahoj, mam na serveru 40 000 prohledavatelnych PDF a djvu dokumentu. Kazdy rekneme 100 stranek dlouhy. Chtel bych napsat aplikaci, ktera bude umet v techto dokumentech fulltextove vyhledavat. Chtel bych poprosit o radu co na to pouzit.
Prvni co me napadlo je pouzit MySQL a pomoci pdftotext udelat databazi techto dokumentu a fulltextove hledani nechat na databazi. Nicmene:
1) Nevim jak by se to pri takto velkem mnozstvi chovalo.
2) Neni nejaky uz hotovy projekt, ktery se timto zabyva?
3) Co byste poradili pouzit vy?

Diky, David

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

27.9.2010 14:23 Filip Jirsák | skóre: 68 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Fulltextove vyhledavani v PDF dokumentech
Odpovědět | | Sbalit | Link | Blokovat | Admin
SQL databázi určitě nepoužívejte, existují specializované nástroje pro fulltexty – např. Lucene nebo Sphinx. Pro Lucene už existují další hotové nadstavby (webová rozhraní apod.), Pro Sphinx možná také něco takového bude.
28.9.2010 20:08 David | skóre: 21 | Praha
Rozbalit Rozbalit vše Re: Fulltextove vyhledavani v PDF dokumentech
Dekuji za reakci. Lucene vypada moc dobre, vyzkousim. S pozdravem.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.