Portál AbcLinuxu, 28. července 2025 12:29


Dotaz: Jak urcit identicke adresare vcetne dat

18.4.2017 19:28 CIJOML
Jak urcit identicke adresare vcetne dat
Přečteno: 497×
Odpovědět | Admin
Ahoj,

resim uklid na disku, kde mi rostou data nekdy od roku 1990. Vzdycky sem to resil tak, ze jsem predchozi disk skopcil do adresare oznacenyho treba old-asus a dal do noveho houmu a tak za ty lety mnohokrat. Ted jsem nasel dalsi dva disky kde to mam delane stejne. Okometricky jsem zjistil, ze obsah asi bude shodny ale adresare jsou samo v jine strukture treba old/zaloha/OLD1/old-asus druhy je treba OLD1/old/OLD1/old-asus dalsi treba OLD2/OLD1/old-asus

no a ted sem to sesypal vsechno na jeden disk je toho za ty doby asi 200 giga a rad bych dostal vystup ze treba

old/zaloha je stejny jako OLD1/old-asus a tak dal. Abych se mohl rozmyslet co smazu.

Resil nekdy nekdo takovyhle orisek?

Zkousel sem fdupes, ale ten vam da vystup po souboru coz je pro me nepouzitelny.

Diky

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

18.4.2017 20:33 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Poznám, a trochu mi pomohol program fdupes.
19.4.2017 08:24 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Řešil.
19.4.2017 19:27 CIJOML
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Prosim otevrit odkazovany clanek neni reseni. Resi duplicity souboru, ja resim cele adresare, ktere chci smazat komplet...
19.4.2017 20:52 cronin | skóre: 49
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
100: Začiatok.
200: Odstrániť duplicitné súbory. 
300: Odstrániť prázdne adresáre.
400: Koniec.
20.4.2017 09:37 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Já jsem to tedy dělal trochu jinak, ale v zásadě ano. Duplicitní soubory jsem nechal nahradit symlinkama, pak jsem si nechal vypsat všechny soubory mimo symlinky (abych viděl jestli tam náhodou není něco zapomenuto), a teprve pak jsem nechal smáznout symlinky a následně adresáře.
19.4.2017 22:14 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Já jsem to před časem řešil takto.
20.4.2017 08:46 R
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
md5deep
Josef Kufner avatar 20.4.2017 11:52 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Úplně na začátku si udělej zálohu ;-) … následující proces bude destruktivní.

Jako první je potřeba udělat v bordelu pořádek. Tedy vyrob si ~/backup a přesuň tam všechny zálohy a zálohy záloh do struktury ~/backup/YYYY-MM-DD/. Prostě zkus odhadnout z jaké doby pochází ten který ~/old/old/old pochází a udělej namísto rekurzivní struktury placatý chronologický seznam.

Jako druhý krok smaž zjevný bordel. Typicky data operačního systému, který už nikdy fungovat nebude. Zbytek zkus nějak zploštit. Přesunout podobná data do smysluplně pojmenovaných adresářů v rámci té každé zálohy. Jde spíš jen o sjednocení top-level struktury, než o pořádný úklid.

Třetím krokem je identifikace důležitých historických dat. To budou například fotky, různé dokumenty a tak. Na taková data doporučuju chronologické třídění – dát to do adresářů ve tvaru ~/archive/YYYY-MM-DD  Popisek (dvě mezery pro lepší automatické zpracování). Je to obecná struktura použitelná na skoro všechno a dobře se v tom dá vyznat. Na podrobnější kategorizaci se vybodni, ale může mít smysl mít několik málo archivů pro různé okruhy zájmu (vyčlenit školní/pracovní věci).

Pak ti tam zbyde kupa bordelu, který není chronologicky dobře klasifikovatelný, ale davá smysl po nějakých skupinách. Třeba adresáře s hrama, tebou vytvořené programy a podobně. To už uvidíš jak na to. Nějak to sesypej dohromady.

Nakonec zbyde úplný bordel. Něco asi rovnou smažeš, zbytek můžeš archivovat do ~/archive/YYYY-00-00  Misc. Výhoda chronologického seznamu je, že i když tam je trocha bordelu, tak je zařazený a nesmrdí všude okolo.
Hello world ! Segmentation fault (core dumped)
Josef Kufner avatar 20.4.2017 11:55 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
… A na závěr si nech spočítat md5sum všech souborů v záloze a ve výsledku a pomocí join si nech najít ty, které zmizely. Pokud bude vše OK, zálohu smaž.
Hello world ! Segmentation fault (core dumped)
20.4.2017 13:23 cronin | skóre: 49
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
Pokud bude vše OK, zálohu smaž.
To by som robil až POTOM, ako bude nová vytriedená, deduplikovaná a akokoľvek inak uprataná štruktúra spoľahlivo odzálohovaná. Viem si veľmi ľahko predstaviť, že mám toto:
$ ls
new/ old/
... a spokojný s týždňovým upratovaním sa idem konečne zbaviť starej, teraz už nepotrebnej zálohy:
$ rm -rf old/*
... ale prsty ako naschvál napíšu:
$ rm -rf old/ *
A je upratané... :-D
20.4.2017 16:21 rm
Rozbalit Rozbalit vše Re: Jak urcit identicke adresare vcetne dat
"make mrproper"

Když dočista, tak dočista. :-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.