Portál AbcLinuxu, 10. května 2025 07:57

Dotaz: python a detekce podobných vět

28.7.2015 12:18 DIK
python a detekce podobných vět
Přečteno: 517×
Odpovědět | Admin
Ahoj všem, poradí mi někdo nějakou vhodnou knihovnu pro python (nejlépe 3), kterou bych byl schopen klasifikovat podobnost vět, resp. odstavců. A bylo by super, kdyby si knihovna poradila se skloňováním a chybějící diakritikou..

Díky předem, DIK

Řešení dotazu:


Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

28.7.2015 12:26 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
Rozbalit Rozbalit vše Re: python a detekce podobných vět
Odpovědět | | Sbalit | Link | Blokovat | Admin

NLTK http://www.nltk.org

USE="-gnome -kde";turris
Aleš Janda avatar 31.7.2015 16:32 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
Rozbalit Rozbalit vše Re: python a detekce podobných vět
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nevím, k čemu to má být, ale pro jednoduché hrubé porovnání se mi osvědčilo následující:
  1. Gzipnout testovací odstavec, vzít výslednou velikost
  2. Gzipnout referenční odstavec, vzít výslednou velikost
  3. Spojit oba odstavce a gzipnout je najednou, porovnat velikost se součtem předchozích velikostí. Pokud bude výsledný gzip menší o více než X procent, odstavce jsou podobné/stejné
Zahrajte si trojšachy přes internet :-)
2.8.2015 11:33 DIK
Rozbalit Rozbalit vše Re: python a detekce podobných vět
Odpovědět | | Sbalit | Link | Blokovat | Admin
Díky všem za reakci, nakonec jsem se rozhodl pro Textblob, který je postavený nad NLTK. DIK
Bystroushaak avatar 1.9.2015 00:47 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: python a detekce podobných vět
Odpovědět | | Sbalit | Link | Blokovat | Admin
Kdyby ještě někdo hledal něco podobného, tak FuzzyWuzzy.
blog.rfox.eu

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.