abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:55 | Komunita

    O víkendu (15:00 až 23:00) probíha EmacsConf 2025, tj. online konference vývojářů a uživatelů editoru GNU Emacs. Sledovat ji lze na stránkách konference. Záznamy budou k dispozici přímo z programu.

    Ladislav Hagara | Komentářů: 0
    dnes 15:44 | Komunita

    Provozovatel internetové encyklopedie Wikipedia jedná s velkými technologickými firmami o uzavření dohod podobných té, kterou má s Googlem. Snaží se tak zpeněžit rostoucí závislost firem zabývajících se umělou inteligencí (AI) na svém obsahu. Firmy využívají volně dostupná data z Wikipedie k trénování jazykových modelů, což zvyšuje náklady, které musí nezisková organizace provozující Wikipedii sama nést. Automatické programy

    … více »
    Ladislav Hagara | Komentářů: 6
    dnes 15:22 | IT novinky

    Evropská komise obvinila síť 𝕏 z porušení unijních pravidel, konkrétně nařízení Evropské unie o digitálních službách (DSA). Vyměřila jí za to pokutu 120 milionů eur (2,9 miliardy Kč). Pokuta je podle názoru amerického ministra zahraničí útokem zahraničních vlád na americký lid. K pokutě se vyjádřil i americký viceprezident: „EU by měla podporovat svobodu projevu, a ne útočit na americké společnosti kvůli nesmyslům“.

    Ladislav Hagara | Komentářů: 5
    včera 17:11 | IT novinky

    Společnost Jolla spustila kampaň na podporu svého nového telefonu Jolla Phone se Sailfish OS. Dodání je plánováno na první polovinu příštího roku. Pokud bude alespoň 2 000 zájemců. Záloha na telefon je 99 €. Cena telefonu v rámci kampaně je 499 €.

    Ladislav Hagara | Komentářů: 23
    včera 15:11 | IT novinky

    Netflix kupuje Warner Bros. včetně jejích filmových a televizních studií HBO Max a HBO. Za 72 miliard dolarů (asi 1,5 bilionu korun).

    Ladislav Hagara | Komentářů: 2
    včera 14:11 | IT novinky

    V Las Vegas dnes končí pětidenní konference AWS re:Invent 2025. Společnost Amazon Web Services (AWS) na ní představila celou řadu novinek. Vypíchnout lze 192jádrový CPU Graviton5 nebo AI chip Trainium3.

    Ladislav Hagara | Komentářů: 0
    včera 00:33 | Nová verze

    Firma Proxmox vydala novou serverovou distribuci Datacenter Manager ve verzi 1.0 (poznámky k vydání). Podobně jako Virtual Environment, Mail Gateway či Backup Server je založená na Debianu, k němuž přidává integraci ZFS, webové administrační rozhraní a další. Datacenter Manager je určený ke správě instalací právě ostatních distribucí Proxmox.

    |🇵🇸 | Komentářů: 8
    4.12. 23:44 | Nová verze

    Byla vydána nová verze 2.4.66 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 5 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    4.12. 14:00 | IT novinky

    Programovací jazyk JavaScript (Wikipedie) dnes slaví 30 let od svého oficiálního představení 4. prosince 1995.

    Ladislav Hagara | Komentářů: 0
    4.12. 04:22 | Bezpečnostní upozornění

    Byly zveřejněny informace o kritické zranitelnosti CVE-2025-55182 s CVSS 10.0 v React Server Components. Zranitelnost je opravena v Reactu 19.0.1, 19.1.2 a 19.2.1.

    Ladislav Hagara | Komentářů: 3
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (47%)
     (19%)
     (18%)
     (22%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 434 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: algoritmus pro vyhledání podobných obrázků a textů.

    21.6.2011 17:09 dik
    algoritmus pro vyhledání podobných obrázků a textů.
    Přečteno: 753×
    Ahoj, mám tuny obrázků/textů a potřebuji se zbavit duplikátů. Rád bych nějakým vhodným algoritmem nahrubo vybral možné duplikáty - finální rozhodnutí udělá brigoš. Poradím mi někdo (python ideál) ,resp. stačí nasměrovat co a kde mám hledat/se naučit? Diky dik

    Odpovědi

    21.6.2011 19:42 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    Duplicity obrázků hledá docela pěkně např. digikam.
    21.6.2011 21:17 ::: | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    porovnani textu bych zkusil udelat po slovech:

    1. pro kazdy text si vytvoris hashovaci tabulku (slovnik v pythonu)

    2. projdes kazdy clanek po slovech a do tabulky si ukladas slova na ktery narazis, pripadne muzes ukladat i jejich pocet

    2. porovnas ty 2 tabulky - pokud se hodne slov vyskytuje v obou, tak texty jsou podobne
    Marián Oravec avatar 22.6.2011 07:39 Marián Oravec | skóre: 22 | Nitra
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    Podobnosť textu: Levenshtein distance

    Podobnosť obrázkov by som riešil už hore uvedeným digikamom.
    Mám rád elektro, ale vypočujem si aj iné...
    22.6.2011 10:54 Ivan
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    Pro podobnost textu se pouzivaji algoritmy zalozene na suffix tree(trie).

    PS: neuvedl jsi kolik casu tomu hodlas sam venovat, jestli hledas nejakej hotovej tool anebo hodlas sam neco vyvijet.
    22.6.2011 17:04 dik
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    Ahoj, no nejradeji bych pouzil nejakou hotovku - idealne hotovy python nebo php modul. Tuto funkcionalitu potrebuju jako vychytavku pro pidi projekt a vyvoj se mi nevyplati. Dik
    22.6.2011 17:51 l0gik | skóre: 22
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    php funkce similar_text + funkce gdi pro převod všech obrázků do jedný velikosti a tvaru.
    22.6.2011 19:42 aa
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    php funkce similar_text
    Ta funkce je O(n^3) tudíž je použitelná jen pro krátké řetězce.
    22.6.2011 19:58 aa
    Rozbalit Rozbalit vše Re: algoritmus pro vyhledání podobných obrázků a textů.
    Porovnávání textů lze založit na n-gramech. Jednoduchá implementace je součástí článku Writing a simple plagiarism detector in Haskell

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.