Portál AbcLinuxu, 6. června 2025 02:44


Dotaz: lemma a stop words pro česky jazyk

20.6.2019 11:17 Pupík
lemma a stop words pro česky jazyk
Přečteno: 588×
Odpovědět | Admin
Čau ve spolek, poradí mi někdo fungující řešení pro extrakci lemma (spokojím se i s stemma) výrazů z českých textů? Ideálně pro Python nebo Bash. Díky, Pupík
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Jendа avatar 20.6.2019 12:52 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: lemma a stop words pro česky jazyk
Odpovědět | | Sbalit | Link | Blokovat | Admin
https://github.com/ufal/morphodita, starší verze byla potřeba patchovat, pro češtinu bohužel vyžaduje non-free model. O ničem free nevím.
21.6.2019 08:32 Pupik
Rozbalit Rozbalit vše Re: lemma a stop words pro česky jazyk
Díky. Morphodita vypadá, z toho co jsem našel na netu, použitelně. Non-free modely najdu kde? Klidně i ofiko koupím... Pupík
Jendа avatar 21.6.2019 13:31 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: lemma a stop words pro česky jazyk
Non-free modely najdu kde?
Jsou odkazované třeba na té mé stránce. Odkaz.
Klidně i ofiko koupím...
Myslím, že to neprodávají (nesmějí prodávat, protože licence toho korpusu na kterém to trénovali), pouze poskytují jako službu. Možná by to šlo ohackovat tak, že si u nich necháš zlematizovat vlastní korpus a na něm natrénuješ vlastní model [tento nápad není z mé hlavy].

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.