Portál AbcLinuxu, 26. dubna 2024 09:17


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Vložit další komentář
11.2.2016 15:22 Filip Jirsák
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Odpovědět | Sbalit | Link | Blokovat | Admin
Takovéhle věci se řeší opačně – při indexování ta slova zaindexujete s diakritiky i bez. Jinak by vám pro vyhledávání vzniklo moc kombinací – kdybyste měl v hledaném textu jenom tři písmena, která mohou mít jedno diakritické znaménko, musel byste vytvořit 23 kombinací a všechny vyhledat.
Josef Kufner avatar 11.2.2016 15:51 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
A nebo se ve funkci na porovnávání stringů použije převodní tabulka. Sice pak je porovnání pomalejší, ale ne o moc a můžeš použít indexy, které nerespektují pravidla daného jazyka, takže je pak telefon nemusí přepočítávat.
Hello world ! Segmentation fault (core dumped)
Bystroushaak avatar 12.2.2016 07:27 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Taky se dá ještě porovnávat syntaktická vzdálenost slov v jejich vektorovém prostoru.
pavlix avatar 12.2.2016 09:10 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
syntaktická vzdálenost slov
To sis teďka vymyslel nebo ten pojem už někdo používá?
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Bystroushaak avatar 12.2.2016 09:59 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Mám takový pocit, že to mám odněkud z MLMU, ale možná jsem to zkomolil. V podstatě se jedná o hledání slov, které se významově nachází na stejných souřadnicích, i když jsou jinak rozdílná v textové reprezentaci. Výhoda je, že by to pak bralo třeba i skloňování rodů a tak.

Jinak další alternativa by bylo použít modifikovanou Levenshtein distance.
12.2.2016 11:07 Filip Jirsák
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
To ale pro vyhledávání adres nemá vůbec smysl. Když hledáte Lipovou ulici, nechcete najít Kaštanovou. Vyhledávat podle Levenštejnovy vzdálenosti dává smysl, řeší to i případy, kdy jméno přesně neznáte (někde je Lipová a někde Lípová ulice). Ještě je dobré k tomu přidat synonyma – pro zkratky (nám. vs náměstí), případně třída/ulice. Každopádně tohle všechno už znamená měnit vyhledávací algoritmy, transformace na text bez diakritik při indexování i vyhledávání může být jen otázka konfigurace, případně přidání dvou řádků programu.
pavlix avatar 12.2.2016 11:14 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Když hledáte Lipovou ulici, nechcete najít Kaštanovou.
To není vůbec jisté. Třeba moje babička místo Ďáblice běžně říkala Čertovo město.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Bystroushaak avatar 12.2.2016 11:33 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
To ale pro vyhledávání adres nemá vůbec smysl. Když hledáte Lipovou ulici, nechcete najít Kaštanovou.
Samozřejmě záleží na způsobu, jakým si ten dataset člověk sestaví. Určitě by nemělo smysl používat to jako běžný slovník synonym. Pointa byla, aby to u Kaštanové našlo i "Kaštenovou", "V kaštanové" atp..

K tomu se nemusí používat pouze algoritmus porovnávající řetězce nějakým fuzzy způsobem, ale dá se každá ulice namapovat na N dimenzionální souřadnice vektorového prostoru, přičemž uživateli nabídneš vše, co je ve vektorovém prostoru v nějaké definivané blízkosti.

Vyhledávání je pak docela rychlé, protože ti stačí spočítat vektor pro zadaný řetězec a podívat se do databáze co je mu blízko. Podrobnosti viz: V případě machine learningu to pak můžeš obohatit ještě daty s modelem jazyka, což ti v tom prostoru přiblíží i věci, které by jinak byly vzdálené, viz to co psal pavlix a Ďáblice / Čertovo město. Pokud to ale chceš dělat automatizovaně, tak na to potřebuješ fakt velké sety dat (dá se to nakrmit třeba všema knížkama, co kdy vyšly a jsou dostupné tak podobně). Je to sice docela náročné na předpočítání, ale pak se v tom rychle vyhledává, proto to používají skoro všechny dnešní vyhledávače.
Bystroushaak avatar 12.2.2016 11:46 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Trochu lepší příklad je třeba "Ulice Bratrů", kde by bylo fajn, kdyby to našlo i "bratří", "bratrská" a "bratrovská", což je všechno významově blízko, ale třeba právě levenštejnova vzdálenost mezi „bratrů“ a „bratrovská“ bude daleko. Daly by se asi najít i smysluplnější příklady, ale nic lepšího mě teď v rychlosti nenapadá. Problém běžnému matchování taky dělá třeba české ch, které je brané jako jedno písmeno. Viz třeba Eiphoune, Keiti Pary nebo Bloothoot – nejlepší zkomoleniny v Seznam.cz Vyhledávání za rok 2015 .
pavlix avatar 12.2.2016 12:09 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Husova, Husitská, Husinecká, to si taky člověk lehce splete.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Josef Kufner avatar 12.2.2016 12:15 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Zdojáky jsou na Githubu. Hrej si ;-)
Hello world ! Segmentation fault (core dumped)
12.2.2016 11:56 Filip Jirsák
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Jestli to chápu správně, jedná se o vyhledávání na mobilním telefonu. Myslím, že účelem není čtrnáct dní počítat index a pak jím zaplnit 64GB SD kartu. Účelem je snazší vyhledávání s omezenou klávesnicí mobilních telefonů.
Bystroushaak avatar 12.2.2016 12:10 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Sice to nemám nijak potvrzené, ale imho by ten index pro názvy ulic zabral jen pár megabajtů. Předpočítat by se pravda musel.
13.2.2016 13:30 JS1 | skóre: 2 | blog: intuition_pump
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
To ale pro vyhledávání adres nemá vůbec smysl. Když hledáte Lipovou ulici, nechcete najít Kaštanovou.
Adres asi ne, ale kdyz treba nekdo hleda kostel, a vyhodi mu to aspon kapli, mozna bude i rad.
Lidstvo čelí v tomto století hrozbě civilizačního kolapsu. Podpořte hnutí klimatickakoalice.cz!
12.2.2016 11:14 Petr
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Lepič znovu zasahuje :-D :-D
Bystroushaak avatar 12.2.2016 11:35 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Já rozumím tomu, proč jsi to napsal, nerozumím ale tomu, že ti to nepřijde dětinské. V tvé hlavě to asi funguje, ale v očích ostatních, kdo tohle budou číst děláš tímhle způsobem dementa především ze sebe.
12.2.2016 18:28 Petr
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
podle ostatnich se tu hodnotis akorat ty
Bystroushaak avatar 13.2.2016 04:42 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
To jako odpověď vůbec nedává smysl.
13.2.2016 11:31 Petr
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Tobě toho taky moc smysl dávat nemůže
Jendа avatar 13.2.2016 07:56 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Já rozumím tomu, proč jsi to napsal, nerozumím ale tomu, že ti to nepřijde dětinské.
Robotovi generujícímu komentáře pomocí Markovových řetězců a bezkontextové gramatiky nemůže něco přijít.
pavlix avatar 13.2.2016 14:22 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Ty už si zase hraješ s robotama? :)
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
kyknos avatar 14.2.2016 02:28 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
robotkama
So the Nationalists and the Socialists have the same policy on Brexit. They should get together and form a...
11.2.2016 16:37 tom
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Odpovědět | Sbalit | Link | Blokovat | Admin
Ona vubec lokalizace OsmAnd je takova dost podivna :-) Na syntezu nazvu to nepouziva jazyk, v kterem ten nazev je, ale jazyk navigace. Takze pokud jedete treba po Nemecku a telefon je v AJ, tak to strasse vyslovuje jako "štrasí". Prekvapive nepomuze ani pokud ma misto svuj vlastni nazev v jazyce navigace (treba Munich), tak to porad bere pouziva nazev mistni (Muenchen), ale syntetizuje podle jazyku navigace.
Josef Kufner avatar 11.2.2016 21:16 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Hello world ! Segmentation fault (core dumped)
13.2.2016 14:20 Jardík
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Odpovědět | Sbalit | Link | Blokovat | Admin
Lepší by bylo ty navigace vyhodit a pořídit si mapu. Navigace je špehující šmejďárna.
Josef Kufner avatar 13.2.2016 16:31 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Osmand je offline navigace, včetně offline vyhledávání a offline map. Jediné, co to špehuje, je stát či region, který si stáhneš.
Hello world ! Segmentation fault (core dumped)
Marián Kyral avatar 14.2.2016 08:12 Marián Kyral | skóre: 29 | blog: Sem_Tam | Frýdek-Místek
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Jardík je 32 bit špehující šmějďárna ;-)
Dreit avatar 14.2.2016 12:00 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Odpovědět | Sbalit | Link | Blokovat | Admin

Mně by se zase líbilo stahování map přes zsync nebo něco na ten způsob - netahat pořád dokola celou mapu, ale jen změny a pak sestavit dohromady

Nope
Josef Kufner avatar 15.2.2016 07:45 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?
Něco na ten způsob se tam nedávno objevilo.
Hello world ! Segmentation fault (core dumped)
Dreit avatar 15.2.2016 17:49 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Osmand - také vás trápí vyhledávání jmen s diakritikou?

Tak to se musím podívat, jestli to moje verze z F-droidu umí :-)

Nope

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.