abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 15:00 | Zajímavý software

Společnost Valve vydala novou beta verzi SteamVR. Z novinek lze zdůraznit oficiální podporu Linuxu. Další informace o podpoře této platformy pro vývoj virtuální reality v Linuxu v diskusním fóru. Hlášení chyb na GitHubu.

Ladislav Hagara | Komentářů: 0
dnes 06:00 | Nová verze

Po necelém roce od vydání verze 0.67 byla vydána verze 0.68 populárního telnet a ssh klienta PuTTY. Podrobnosti v přehledu změn. Řešeny jsou také bezpečnostní chyby.

Ladislav Hagara | Komentářů: 0
včera 21:32 | Nasazení Linuxu

Canonical představuje nejnovější verzi chytré helmy DAQRI s Ubuntu pro rozšířenou realitu. K vidění bude příští týden v Barceloně na veletrhu Mobile World Congress 2017.

Ladislav Hagara | Komentářů: 0
včera 21:31 | Pozvánky

Pro zájemce o hlubší znalosti fungování operačních systémů připravila MFF UK nový předmět Pokročilé operační systémy, v rámci něhož se vystřídají přednášející nejen z řad pracovníků fakulty, ale dorazí také odborníci ze společností AVAST, Oracle, Red Hat a SUSE. Tento předmět volně navazuje na kurz Operační systémy ze zimního semestru, ale pokud máte praktické zkušenosti odjinud (například z přispívání do jádra Linuxu) a chcete si

… více »
Martin Děcký | Komentářů: 6
včera 21:30 | Pozvánky

Czech JBoss User Group Vás srdečně zve na setkání JBUG v Brně, které se koná ve středu 1. března 2017 v prostorách Fakulty Informatiky Masarykovy Univerzity v místnosti A318 od 18:00. Přednáší Tomáš Remeš a Matěj Novotný na téma CDI 2.0 - New and Noteworthy. Více informací na Facebooku a na Twitteru #jbugcz.

mjedlick | Komentářů: 0
20.2. 23:45 | Zajímavý software

Na blogu Qt bylo představeno Qt 3D Studio. Jedná se o produkt dosud známý pod názvem NVIDIA DRIVE™ Design Studio. NVIDIA jej věnovala Qt. Jedná se o několik set tisíc řádků zdrojového kódu. Qt 3D Studio bude stejně jako Qt k dispozici jak pod open source, tak pod komerční licencí. Ukázka práce s Qt 3D Studiem na YouTube.

Ladislav Hagara | Komentářů: 10
20.2. 17:50 | Komunita

Nadace The Document Foundation (TDF) zastřešující vývoj svobodného kancelářského balíku LibreOffice slaví 5 let od svého oficiálního vzniku. Nadace byla představena 28. září 2010. Formálně byla založena ale až 17. února 2012.

Ladislav Hagara | Komentářů: 0
20.2. 12:50 | Komunita

Mozilla.cz informuje, že dosud experimentální funkce Page Shot z programu Firefox Test Pilot (zprávička) se stane součástí Firefoxu. Page Shot je nástroj pro vytváření snímků webových stránek. Umí výběr oblasti, prvku stránky (např. odstavce), nebo uložení snímku celé stránky. Snímky lze ukládat na disk nebo nahrávat na server Mozilly. Nedávno bylo oznámeno, že se součástí Firefoxu stane Activity Stream.

Ladislav Hagara | Komentářů: 35
20.2. 04:10 | Nová verze

Po 10 týdnech vývoje od vydání Linuxu 4.9 (zprávička) oznámil Linus Torvalds, mj. již 20 let žijící v USA, vydání Linuxu 4.10 (LKML). Přehled nových vlastností a vylepšení například na Kernel Newbies a v Jaderných novinách (1, 2 a 3). Kódové jméno Linuxu 4.10 je Fearless Coyote.

Ladislav Hagara | Komentářů: 28
19.2. 15:55 | Zajímavý projekt

Vyzkoušet si příkazy a vyřešit několik úkolů lze na stránkách Commandline Challenge (CMD Challenge). Úkoly lze řešit různými způsoby, důležitý je výsledek. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 19
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (13%)
 (2%)
 (71%)
 (4%)
 (10%)
Celkem 682 hlasů
 Komentářů: 65, poslední dnes 16:18
Rozcestník

Dotaz: Jak najit stejne soubory?

5.5.2006 08:28 Adam.J | skóre: 4
Jak najit stejne soubory?
Přečteno: 442×
Dobry den, na ftp server se objevujou obcas stejne soubory, a tak jsem hledal najakou cestu jak je najit. Zatim jsem nic nenasel, hledal jsem tady v diskuzi, v man find, apt-cache search , ovsem nic, rekl bych ze spatne hledam. Napadla mne myslenka to v bashi naprogramovat porovnani kadeho souboru s kazdym, coz bude hodne neohrabane. Jak to mate vyresene Vy ?

Adam J.

Odpovědi

5.5.2006 09:02 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Jojo, už se to tady někdy řešilo, ale teď nemůžu najít to vlákno. Našel jsem ale svůj prográmek na hledání duplicitních souborů, který jsem tehdy psal:
#!/usr/bin/env python
import os,md5

def CalcMD5(filename):
  buffersize = 1000000
  sum = md5.new()
  f = open(filename)
  while True:
    data = f.read(buffersize)
    if not data: break
    sum.update(data)
  f.close()
  return sum.hexdigest()


def removefile(name):
  print 'removing', name
# os.remove(name)

def removeduplicit(filelist):
  md5sums = {}
  for name in filelist:
    sum = CalcMD5(name)
    if not md5sums.has_key(sum):
      md5sums[sum] = name
      continue

    name1 = md5sums[sum]
    name2 = name
    print 'duplicit files: ', name1, name2
    if os.path.getctime(name1) > os.path.getctime(name2):
      removefile(name1)
      md5sums[sum] = name2
    else:
      removefile(name2)


path = '.'

sizes = {}
for root, dirs, files in os.walk(path):
  for file in files:
    name = os.path.join(root, file)
    if not os.path.isfile(name): continue
    size = os.path.getsize(name)
    if sizes.has_key(size):
      sizes[size].append(name)
    else:
      sizes[size] = [name]


for k in sizes.keys():
  if len(sizes[k]) > 1:
    removeduplicit(sizes[k])
Ten program najde v aktuálním adresáři všechny soubory se stejným obsahem (název se může lišit), ponechá jen ten nejnovější a ostatní smaže.
5.5.2006 09:04 Michal Karas | skóre: 45 | blog: /dev/random
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Bylo to tady.
5.5.2006 09:07 Michal Karas | skóre: 45 | blog: /dev/random
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Ahoj, teď jsem jenom zkusmo napsal něco takového:
find ./ -type f -print0 | xargs -0 md5sum | sort | \
awk '{ if (md5 == $1) print cesta,$2; md5=$1; cesta=$2 }
Nestačilo by to?
5.5.2006 09:23 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Díky za ten odkaz, nechápu, jak jsi to dokázal najít. Psal jsem do vyhledávání kusy toho programu a různá slova z diskuse, ale stejně jsem nic nenašel.

Nerad bych zopakoval tu tehdejší bouřlivou debatu, jen podotýkám, že je lepší nejprve porovnat velikosti, a pak teprve spočítat md5.
5.5.2006 09:36 Adam.J | skóre: 4
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Predpokladam, ze fdupes by to mel takhle delat, ne ? no jak se divam tam 16000 souboru(cca 600G) to projede celkem rychle, takze asi jo :)
5.5.2006 09:38 Adam.J | skóre: 4
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
ups, 600G to bych kecal je to nej cca 80G
5.5.2006 14:18 Michal Karas | skóre: 45 | blog: /dev/random
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Asi jo. Já si to zkoušel jen na pár dokumentech, kde to byla rychlovka. :)
5.5.2006 17:38 miso | skóre: 36 | blog: iSCSI_initiator_howto | Praha
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Ten dotaz som vtedy polozil ja a uz som par krat lutoval, ze som vtedy este nebol registrovany a lahsie by som ho nasiel (ked som sa k tomu po case chcel znovu vratit)
Zatial stale pouzivam md5, ale dost to trva, nastastie sa mi este nestalo, zeby som potreboval vysledky hned.
Pri 60-80G by som naozaj doporucil porovnat najprv velkost
Project Satan infects Calculon with Werecar virus
5.5.2006 09:13 lucaash
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Mě se osvědčilo fdupes.

Zdar,

Lucaash
5.5.2006 09:31 Adam.J | skóre: 4
Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
Diky vsem, myslim, ze to vyhraje fdupes :) No jak se divam na manual tak to umi pracovat se soft/hard/linkami, a furu dalsich prepinacu, proste super programek :) presne takovy jaky jsem hledal.

PS: a je v debianu jako balicek :D

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.