Portál AbcLinuxu, 26. dubna 2024 06:27


Dotaz: Nalezení shodných pasáží v jednom textu

7.4.2012 10:24 Iohannes
Nalezení shodných pasáží v jednom textu
Přečteno: 190×
Odpovědět | Admin

Dobrý den,
řeším takový malý problém: mám poměrně dlouhý text, ve kterém se různá místa opakují (často beze změn, občas s drobnými změnami), zkrátka chvíli autor povídá o nějakém tématu a pak zopakuje to, co již řekl dříve, pak chvíli zase o něčem povídá a do toho vloží opět něco z předchozí části.

Rád bych se zeptal, zdali neexistuje způsob, jak tyto shodné (a nejlépe i téměř shodné) pasáže v jednom textu najít? Většinu jsem jich našel manuálně, ale mohlo mi něco uniknout, a bylo by také fajn, pokud bych příště mohl alespoň částečně tento proces zautomatizovat.
Děkuji moc za rady.

Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Prcek avatar 7.4.2012 11:29 Prcek | skóre: 43 | Jindřichův Hradec / Brno
Rozbalit Rozbalit vše Re: Nalezení shodných pasáží v jednom textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Něco takového je třeba na Odevzdej.cz, ale tam se porovnává vložený soubor se soubory v jejich databázi. Asi by šlo nahrát tam ten soubor 2x pokaždé pod jiným jménem (možná to ani není nutné, nevím) a potom by systém měl vypsat podobnosti mezi těmito dvěma (stejnými) soubory. Ale jestli to tak opravdu funguje, jsem nezkoušel.
Člověk je takový, jak vypadá... A já vypadám jako pravá, nefalšovaná děvka!!!
8.4.2012 09:38 Iohannes
Rozbalit Rozbalit vše Re: Nalezení shodných pasáží v jednom textu
Děkuji za tip a rád to vyzkouším. Přiznám se jen, že bych dal prvně přednost něčemu, co by fungovalo offline či alespoň neveřejně. Sice se nejedná o strategicky důležitý text, ale protože je v něm skutečně hodně práce, přece jen se mi jej nechce příliš někam takto posílat. Myslím ale, že Váš tip jistě využiji na něco jiného :-).

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.