abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    11.7. 16:44 | Komunita

    Dnes v 17:30 bude oficiálně vydána open source počítačová hra DOGWALK vytvořena v 3D softwaru Blender a herním enginu Godot. Release party proběhne na YouTube od 17:00.

    Ladislav Hagara | Komentářů: 3
    11.7. 14:55 | Humor

    McDonald's se spojil se společností Paradox a pracovníky nabírá také pomocí AI řešení s virtuální asistentkou Olivii běžící na webu McHire. Ian Carroll a Sam Curry se na toto AI řešení blíže podívali a opravdu je překvapilo, že se mohli přihlásit pomocí jména 123456 a hesla 123456 a získat přístup k údajům o 64 milionech uchazečů o práci.

    Ladislav Hagara | Komentářů: 9
    11.7. 00:11 | Nová verze

    Byla vydána (𝕏) červnová aktualizace aneb nová verze 1.102 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.102 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    10.7. 21:00 | Bezpečnostní upozornění

    Byla vydána nová verze 2.4.64 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 8 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 4
    10.7. 15:22 | Nová verze

    Společnost xAI na síti 𝕏 představila Grok 4, tj. novou verzi svého AI LLM modelu Grok.

    Ladislav Hagara | Komentářů: 12
    10.7. 12:55 | Bezpečnostní upozornění

    Ministerstvo vnitra odhalilo závažný kyberincident v IT systému resortu. Systém, do kterého se dostal útočník bez oprávnění, byl odpojen a nedošlo k odcizení dat [𝕏].

    Ladislav Hagara | Komentářů: 16
    10.7. 11:55 | Humor

    Před rokem byla streamovací služba HBO Max přejmenována na Max. Dle managementu slovo HBO v názvu nebylo důležité. Včera byl Max přejmenován zpět na HBO Max. Kolik milionů dolarů to stálo? 😂

    Ladislav Hagara | Komentářů: 14
    10.7. 02:11 | Nová verze

    Byla vydána nová major verze 8.0.0 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata (Wikipedie). Přehled novinek v oficiálním oznámení a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    10.7. 01:11 | Nová verze

    Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.4. Přehled novinek s náhledy a videi v oznámení na blogu.

    Ladislav Hagara | Komentářů: 1
    10.7. 00:11 | IT novinky

    Instituce státní správy nebudou smět využívat produkty, aplikace, řešení, webové stránky a webové služby poskytované čínskou společností DeepSeek. Na doporučení Národního úřadu pro kybernetickou a informační bezpečnost rozhodla o jejich zákazu vláda Petra Fialy na jednání ve středu 9. července 2025.

    Ladislav Hagara | Komentářů: 8
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (27%)
     (7%)
     (3%)
     (1%)
     (1%)
     (4%)
    Celkem 389 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Dotaz: Jak najit stejne soubory?

    5.5.2006 08:28 Adam.J | skóre: 4
    Jak najit stejne soubory?
    Přečteno: 493×
    Dobry den, na ftp server se objevujou obcas stejne soubory, a tak jsem hledal najakou cestu jak je najit. Zatim jsem nic nenasel, hledal jsem tady v diskuzi, v man find, apt-cache search , ovsem nic, rekl bych ze spatne hledam. Napadla mne myslenka to v bashi naprogramovat porovnani kadeho souboru s kazdym, coz bude hodne neohrabane. Jak to mate vyresene Vy ?

    Adam J.

    Odpovědi

    5.5.2006 09:02 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Jojo, už se to tady někdy řešilo, ale teď nemůžu najít to vlákno. Našel jsem ale svůj prográmek na hledání duplicitních souborů, který jsem tehdy psal:
    #!/usr/bin/env python
    import os,md5
    
    def CalcMD5(filename):
      buffersize = 1000000
      sum = md5.new()
      f = open(filename)
      while True:
        data = f.read(buffersize)
        if not data: break
        sum.update(data)
      f.close()
      return sum.hexdigest()
    
    
    def removefile(name):
      print 'removing', name
    # os.remove(name)
    
    def removeduplicit(filelist):
      md5sums = {}
      for name in filelist:
        sum = CalcMD5(name)
        if not md5sums.has_key(sum):
          md5sums[sum] = name
          continue
    
        name1 = md5sums[sum]
        name2 = name
        print 'duplicit files: ', name1, name2
        if os.path.getctime(name1) > os.path.getctime(name2):
          removefile(name1)
          md5sums[sum] = name2
        else:
          removefile(name2)
    
    
    path = '.'
    
    sizes = {}
    for root, dirs, files in os.walk(path):
      for file in files:
        name = os.path.join(root, file)
        if not os.path.isfile(name): continue
        size = os.path.getsize(name)
        if sizes.has_key(size):
          sizes[size].append(name)
        else:
          sizes[size] = [name]
    
    
    for k in sizes.keys():
      if len(sizes[k]) > 1:
        removeduplicit(sizes[k])
    
    Ten program najde v aktuálním adresáři všechny soubory se stejným obsahem (název se může lišit), ponechá jen ten nejnovější a ostatní smaže.
    5.5.2006 09:04 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Bylo to tady.
    5.5.2006 09:07 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Ahoj, teď jsem jenom zkusmo napsal něco takového:
    find ./ -type f -print0 | xargs -0 md5sum | sort | \
    awk '{ if (md5 == $1) print cesta,$2; md5=$1; cesta=$2 }
    Nestačilo by to?
    5.5.2006 09:23 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Díky za ten odkaz, nechápu, jak jsi to dokázal najít. Psal jsem do vyhledávání kusy toho programu a různá slova z diskuse, ale stejně jsem nic nenašel.

    Nerad bych zopakoval tu tehdejší bouřlivou debatu, jen podotýkám, že je lepší nejprve porovnat velikosti, a pak teprve spočítat md5.
    5.5.2006 09:36 Adam.J | skóre: 4
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Predpokladam, ze fdupes by to mel takhle delat, ne ? no jak se divam tam 16000 souboru(cca 600G) to projede celkem rychle, takze asi jo :)
    5.5.2006 09:38 Adam.J | skóre: 4
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    ups, 600G to bych kecal je to nej cca 80G
    5.5.2006 14:18 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Asi jo. Já si to zkoušel jen na pár dokumentech, kde to byla rychlovka. :)
    5.5.2006 17:38 miso | skóre: 36 | blog: iSCSI_initiator_howto | Praha
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Ten dotaz som vtedy polozil ja a uz som par krat lutoval, ze som vtedy este nebol registrovany a lahsie by som ho nasiel (ked som sa k tomu po case chcel znovu vratit)
    Zatial stale pouzivam md5, ale dost to trva, nastastie sa mi este nestalo, zeby som potreboval vysledky hned.
    Pri 60-80G by som naozaj doporucil porovnat najprv velkost
    Project Satan infects Calculon with Werecar virus
    5.5.2006 09:13 lucaash
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Mě se osvědčilo fdupes.

    Zdar,

    Lucaash
    5.5.2006 09:31 Adam.J | skóre: 4
    Rozbalit Rozbalit vše Re: Jak najit stejne soubory?
    Diky vsem, myslim, ze to vyhraje fdupes :) No jak se divam na manual tak to umi pracovat se soft/hard/linkami, a furu dalsich prepinacu, proste super programek :) presne takovy jaky jsem hledal.

    PS: a je v debianu jako balicek :D

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.