Přihlášení | Registrace

napište » Zprávičky

dnes 05:55 | Nová verze

Po více než 7 měsících vývoje od vydání verze 6.8 byla vydána nová verze 6.9 svobodného open source redakčního systému WordPress. Kódové jméno Gene bylo vybráno na počest amerického jazzového klavíristy Gene Harrise (Ray Brown Trio - Summertime).

Ladislav Hagara | Komentářů: 7

Vývoj webového prohlížeče Ladybird (11/2025)

dnes 05:11 | Komunita

Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za listopad (YouTube).

Ladislav Hagara | Komentářů: 0

Google Chrome 143

dnes 01:55 | Nová verze

Google Chrome 143 byl prohlášen za stabilní. Nejnovější stabilní verze 143.0.7499.40 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 13 bezpečnostních chyb.

Ladislav Hagara | Komentářů: 0

Hardwarový a softwarový průzkum Steamu - 11/2025

včera 19:33 | Nová verze

Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu dosáhl 3,2 %. Nejčastěji používané linuxové distribuce jsou Arch Linux, Linux Mint a Ubuntu. Při výběru jenom Linuxu vede SteamOS Holo s 26,42 %. Procesor AMD používá 66,72 % hráčů na Linuxu.

Ladislav Hagara | Komentářů: 0

Ubuntu Pro pro WSL

včera 15:22 | IT novinky

Canonical oznámil (YouTube), že nově nabízí svou podporu Ubuntu Pro také pro instance Ubuntu na WSL (Windows Subsystem for Linux).

Ladislav Hagara | Komentářů: 0

Samsung Galaxy Z TriFold

včera 13:11 | IT novinky

Samsung představil svůj nejnovější chytrý telefon Galaxy Z TriFold (YouTube). Skládačka se nerozkládá jednou, ale hned dvakrát, a nabízí displej s úhlopříčkou 10 palců. V České republice nebude tento model dostupný.

Ladislav Hagara | Komentářů: 3

Armbian 25.11.1

včera 12:33 | Nová verze

Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 25.11.1. Přehled novinek v Changelogu.

Ladislav Hagara | Komentářů: 1

FreeBSD 15.0

včera 04:00 | Nová verze

Byla vydána nová verze 15.0 svobodného unixového operačního systému FreeBSD. Podrobný přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 7

Ubuntu Touch 24.04 1.1 a 20.04 OTA-11

včera 03:00 | Nová verze

UBports, nadace a komunita kolem Ubuntu pro telefony a tablety Ubuntu Touch, vydala Ubuntu Touch 24.04 1.1 a 20.04 OTA-11. Vedle oprav chyb a drobných vylepšení je řešen také středně závažný bezpečnostní problém.

Ladislav Hagara | Komentářů: 0

Ajťácké adventní kalendáře 2025

včera 00:33 | IT novinky

I letos vyšla řada ajťáckých adventních kalendářů: Advent of Code 2025, Perl Advent Calendar 2025, CSS Advent Calendar 2025, Advent of A11Y 2025, Advent of AI Security 2025, Advent of Agents (in Google) 2025, Advent of Svelte 2025, …

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (34%)

Gitlab (47%)

Atlassian (19%)

Bitbucket (18%)

Gitea (23%)

Mercurial (15%)

jen git (25%)

jen svn (16%)

Jiné (uvedu v diskusi) (18%)

Celkem 426 hlasů

Komentářů: 18, poslední včera 18:34

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Jak efektivně odstranit duplicitní soubory?

Štítky: dokumenty, GUI, hash, Mate, odstranit, smazat, terminál

Dotaz: Jak efektivně odstranit duplicitní soubory?

10.12.2014 08:14 neprihlaseny Indian
Jak efektivně odstranit duplicitní soubory?

Přečteno: 1397×

Odpovědět | Admin

Ahoj, potřebuji smazat duplicitní fotky, dokumenty, aj. v adresáři s celkovou velikostí 160GB. Chci mít jen jednu kopii, ostatní duplicitní soubory chci smazat. V souborech si poté udělám pořádek, ale ještě předtím bych rád tyto duplicity a poté i prázdné složky smazal, abych měl práci ulehčenou.

Potřebuju poradit jaký nástroj na to nasadit, tak aby uměl dostatečně rychle přečíst hash souborů (či jaké metody na zjišťování souborů zde jsou?) a byl jednoduchý na obsluhu. Nevyžaduji GUI, terminál mi vyhovuje. Máte nějakou zkušenost co na těchto 160GB dat nasadit? Děkuji, Indián :)

Řešení dotazu:

Nástroje: Začni sledovat (2) ?

Odpovědi

10.12.2014 08:28 Petr
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

http://www.abclinuxu.cz/blog/Par_slov/2014/8/velky-uklid-v-pocitaci

10.12.2014 08:44 neprihlaseny Indian
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Děkuji fdupes je to co jsem hledal :)

10.12.2014 13:17 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Ještě doplním:

Líbí se mi volba -m, která najde duplicitní soubory a udělá z nich hardlinky.

# aptitude install fslint $ /usr/share/fslint/fslint/findup -m /data $ /usr/share/fslint/fslint/findup --help

-- RÁMO: psí tábor , ETriatlon: Výuka plavání

10.12.2014 11:44 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Pustil bych rekurzivně sha1sum a potom výsledek setřídil a prošel.

10.12.2014 12:05 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Třídění je zbytečné.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

10.12.2014 18:40 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Nenapadá mě jak přímočaře napsat skript, který najde duplicity v nesetříděném seznamu.

10.12.2014 19:17 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Použiješ ten hash jako index ve slovníku.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

10.12.2014 21:01 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

No dobře, ještě jsem předpokládal, že se to bude dělat pomocí pár řádků v shellu :)

10.12.2014 21:29 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

A shell to snad neumí?

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

10.12.2014 22:27 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

Aha, umí. Akorát ve výše uvedeném blogpostu měly jenom cesty jenom k duplikátům 150 mega, takže se to možná nevejde do paměti.

11.12.2014 01:09 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: Jak efektivně odstranit duplicitní soubory?

No po té zkušenosti z úklidem, mi připadá, že optimální by bylo mít řešení ve 3 postupných krocích.

Projít jen adresářovou strukturu a setřídit/zahešovat soubory podle velikosti. Různě velké soubory nejsou stejné.
Pro stejně velké soubory, načíst do paměti první sektor (512B nebo 4k) a porovnat je byte_to_byte (samozřejmě porovnávat je ne po bytech, ale slovech procesoru), Hash je poměrně spousta počítání proti přimému porovnání a dá se očekávat, že pokud se soubory liší, začnou se většinou lišit dost brzy.
Tím se vystrukturují "potenciálně stejné soubory" a u nich má možná smysl počítat hash, ale není mi to úplně jasné. Připadá mi, že přímé porovnání systém méně zatíží. Rozdíl identifikuji ihned a ne až po projítí celého souboru. A pravděpodobnost, že po projítí úvodního stejného sektoru, bych měl někde v hloubi souboru rozdíly a byly by uspořádány tak, že např se souborů A,B,C, by B a C byly stejné, ale já bych nejdříve vzal A a po zjištění rozdílu u obou bych musel ještě separátně porovnat B a C mi připadá menší, než ztráty z náročnějšího výpočtu hashe u všech souborů

Navíc u menších souborů, které by se všechny "potenciálně stejné" vešly do paměti, bych porovnání mohl celé dělat způsobem 2.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje