Portál AbcLinuxu, 12. května 2025 05:20

Dotaz: vyhledavani duplicitnich souboru

19.11.2006 12:22 Mira
vyhledavani duplicitnich souboru
Přečteno: 198×
Odpovědět | Admin
zdravim, muj dotaz je mozna trosku off topic ale mam v planu v C# vytvorit pgm na vyhledavani duplicitnich souboru podle ruznych kriterii, a hlavnim asi bude obsah, tak by me zajimaly vase nazory na tuto problematiku, resp jak nejeefektivneji prohledavat data atd.. diky za radu
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

19.11.2006 12:36 Michal Marek (twofish) | skóre: 55 | blog: { display: blog; } | Praha
Rozbalit Rozbalit vše Re: vyhledavani duplicitnich souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pokud ti jde o identický obsah, tak stačí spočítat hashe souborů a hledat duplicity mezi nima. Koukni se třeba na program fdupes, jde to i na pár řádků v shellu...
xkucf03 avatar 19.11.2006 13:55 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: vyhledavani duplicitnich souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nejjednodušší je to, jak píše Michal, přes hashe. K tomu bych měl ještě jeden optimalizační tip: nejdřív zjisti velikosti souborů - ty, které se liší velikostí už nemusíš porovnávat, protože je jasné, že mají jiný obsah (a hashe), to ti u velkých souborů ušetří spoustu času.

Složitější metoda je u textových souborů ignorovat mezery, tabulátory a konce řádků. Nebo zjišťovat, jak velká změna mezi nimi je. Ale nevím, jestli je to to, co chceš.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
19.11.2006 14:27 kajo
Rozbalit Rozbalit vše Re: vyhledavani duplicitnich souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
Naco tvorit, co je uz vymyslene: Clone Spy (ale pod Win..)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.