Portál AbcLinuxu, 13. července 2025 16:25


Dotaz: algoritmus pro vyhledání podobných obrázků a textů.

21.6.2011 17:09 dik
algoritmus pro vyhledání podobných obrázků a textů.
Přečteno: 731×
Odpovědět | Admin
Ahoj, mám tuny obrázků/textů a potřebuji se zbavit duplikátů. Rád bych nějakým vhodným algoritmem nahrubo vybral možné duplikáty - finální rozhodnutí udělá brigoš. Poradím mi někdo (python ideál) ,resp. stačí nasměrovat co a kde mám hledat/se naučit? Diky dik
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

21.6.2011 19:42 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Odpovědět | | Sbalit | Link | Blokovat | Admin
Duplicity obrázků hledá docela pěkně např. digikam.
21.6.2011 21:17 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Odpovědět | | Sbalit | Link | Blokovat | Admin
porovnani textu bych zkusil udelat po slovech:

1. pro kazdy text si vytvoris hashovaci tabulku (slovnik v pythonu)

2. projdes kazdy clanek po slovech a do tabulky si ukladas slova na ktery narazis, pripadne muzes ukladat i jejich pocet

2. porovnas ty 2 tabulky - pokud se hodne slov vyskytuje v obou, tak texty jsou podobne
Marián Oravec avatar 22.6.2011 07:39 Marián Oravec | skóre: 22 | Nitra
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Odpovědět | | Sbalit | Link | Blokovat | Admin
Podobnosť textu: Levenshtein distance

Podobnosť obrázkov by som riešil už hore uvedeným digikamom.
Mám rád elektro, ale vypočujem si aj iné...
22.6.2011 10:54 Ivan
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pro podobnost textu se pouzivaji algoritmy zalozene na suffix tree(trie).

PS: neuvedl jsi kolik casu tomu hodlas sam venovat, jestli hledas nejakej hotovej tool anebo hodlas sam neco vyvijet.
22.6.2011 17:04 dik
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Ahoj, no nejradeji bych pouzil nejakou hotovku - idealne hotovy python nebo php modul. Tuto funkcionalitu potrebuju jako vychytavku pro pidi projekt a vyvoj se mi nevyplati. Dik
22.6.2011 17:51 l0gik | skóre: 22
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
php funkce similar_text + funkce gdi pro převod všech obrázků do jedný velikosti a tvaru.
22.6.2011 19:42 aa
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
php funkce similar_text
Ta funkce je O(n^3) tudíž je použitelná jen pro krátké řetězce.
22.6.2011 19:58 aa
Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
Odpovědět | | Sbalit | Link | Blokovat | Admin
Porovnávání textů lze založit na n-gramech. Jednoduchá implementace je součástí článku Writing a simple plagiarism detector in Haskell

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.