abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 23:33 | Zajímavý software

Byl vydán ShellCheck ve verzi 0.4.6. Jedná se o nástroj pro statickou analýzu shellových skriptů. Shellové skripty lze analyzovat na webové stránce ShellChecku, v terminálu nebo přímo z textových editorů. Příklady kódů, na které analýza upozorňuje a doporučuje je přepsat. ShellCheck je naprogramován v programovacím jazyce Haskell. Zdrojové kódy jsou k dispozici na GitHubu pod licencí GPLv3.

Ladislav Hagara | Komentářů: 0
včera 23:33 | Pozvánky

Czech JBoss User Group zve na setkání JBUG v Brně, které se koná ve středu 5. dubna 2017 v prostorách Fakulty informatiky Masarykovy univerzity v místnosti A318 od 18:00. Přednáší Pavol Loffay na téma Distributed Tracing and OpenTracing in Microservice Architecture.

… více »
mjedlick | Komentářů: 0
včera 11:33 | Zajímavý článek

Národní centrum kybernetické bezpečnosti (NCKB) vypracovalo (pdf) 26 podrobných bezpečnostních doporučení pro síťové správce. Tato doporučení jsou nastavena tak, aby je bylo možné aplikovat v každé instituci. Jsou rozdělena na tři základní části: bezpečnost infrastruktury, bezpečnost stanic a serverů a bezpečnost uživatelů.

Ladislav Hagara | Komentářů: 9
včera 05:55 | Komunita

Prezident Nadace pro svobodný software (FSF) Richard M. Stallman vyhlásil na slavnostním ceremoniálu v rámci konference LibrePlanet 2017 vítěze Free Software Awards za rok 2016. Ocenění za společenský přínos získal SecureDrop (Wikipedie). Za rozvoj svobodného softwaru byl oceněn Alexandre Oliva (Wikipedie).

Ladislav Hagara | Komentářů: 0
včera 04:44 | Nová verze

Byla vydána verze 0.7.0 debugovacího nástroje cgdb. Mezi novinky patří například zvýrazňování syntaxe jazyka Rust. Podrobnosti v poznámkách o vydání.

Neel | Komentářů: 0
25.3. 22:00 | Komunita

Portál Stack Overflow po roce opět vyzpovídal své uživatele, jedná se především o vývojáře softwaru, a zveřejnil (podcast) detailní výsledky průzkumu. Průzkumu se letos zúčastnilo více než 64 tisíc vývojářů. Jejich nejmilovanější platformou je linuxový desktop. Ten je také druhou nejpoužívanější platformou vývojářů.

Ladislav Hagara | Komentářů: 7
24.3. 11:55 | Komunita

Vývojový tým OpenSSL ve spolupráci s iniciativou Core Infrastructure konsorcia Linux Foundation spustil proces přelicencování této kryptografické knihovny ze současné licence na licenci Apache Licence v 2.0 (ASLv2). Nová licence usnadní začleňování OpenSSL do dalších svobodných a open source projektů. Všichni dosavadní vývojáři OpenSSL (Authors) obdrží v následujících dnech email s prosbou o souhlas se změnou licence.

Ladislav Hagara | Komentářů: 32
24.3. 01:11 | Komunita

Před třemi týdny Mozilla.cz představila projekt Photon, jehož cílem je návrh a implementace nového vzhledu Firefoxu. Včera zveřejnila první náhled vzhledu Photon. Práce na projektu Photon jsou rozděleny do pěti týmů, které celkem čítají 19 lidí. Zaměřují se na zlepšení prvního spuštění Firefoxu a zaujetí nových uživatelů, celkovou úpravu vzhledu, zlepšení animací, zrychlení odezvy uživatelského rozhraní a také upravení nabídek. Vývoj lze sledovat v Bugzille.

Ladislav Hagara | Komentářů: 50
23.3. 20:00 | Komunita

OneDrive pro firmy je již ve webových prohlížečích na Linuxu stejně rychlý jako na Windows. Microsoft opravil chybu z listopadu loňského roku. OneDrive pro firmy běžel na Linuxu mnohem pomaleji než na Windows. V popisu chyby bylo uvedeno, že stačilo v prohlížeči na Linuxu nastavit v user-agentu Windows a vše se zrychlilo. Odpovědí Microsoftu bylo (Internet Archive: Wayback Machine), že Linux není podporován. Po bouřlivých diskusích na redditu i Hacker News byla chyba nalezena a opravena.

Ladislav Hagara | Komentářů: 9
23.3. 19:00 | Zajímavý projekt

Byla vyhlášena soutěž Hackaday Prize 2017. Soutěž je určena vývojářům open source hardwaru. Pro výherce je připraveno celkově 250 tisíc dolarů. Každý ze 120 finalistů získá tisíc dolarů. Nejlepší pak navíc 50, 30, 20, 15, 10 a 5 tisíc dolarů. Jedná se již o čtvrtý ročník soutěže. V roce 2014 zvítězil projekt globální sítě open source pozemních satelitních stanic SatNOGS. V roce 2015 zvítězil open source systém pro řízení elektrických invalidních vozíků pohybem očí Eyedriveomatic. V roce 2016 zvítězil modulární robot Dtto.

Ladislav Hagara | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (14%)
 (2%)
 (71%)
 (3%)
 (10%)
Celkem 946 hlasů
 Komentářů: 72, poslední 1.3. 11:16
    Rozcestník

    Dotaz: efektivní hledání duplikátních souborů

    25.7.2014 23:08 lertimir | skóre: 60 | blog: Par_slov
    efektivní hledání duplikátních souborů
    Přečteno: 849×
    Máme nějaký nástroj na efektivní hledání duplikátních souborů. Zatím jsem narazil jen na konstrukce typu
    find -type f -exec md5sum '{}' ';' | sort | uniq --all-repeated=separate -w 33 | cut -c 35-
    
    případně programy fdupes a fslint. Což není, co bych si představoval. Hledám program, který by na jméno souboru odpověděl jestli je sám nebo má duplikáty podobně efektivním způsobem jako je hledání locate. Představoval bych si to podobně jako locate ve dvou částech. první pravidelný univerzální běh spočte hash a vytvoří DB s primárním klíčem hash a value bude seznam souborů, které tento hash mají. Pak by se dalo rozumně rychle dotazovat jednak na duplikát k souboru a také na to jaké máme soubory s duplicitou 2, 3 atd.

    Řešení dotazu:


    Odpovědi

    25.7.2014 23:29 jadd | skóre: 34 | blog: Greenhorn
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    25.7.2014 23:58 pipi
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    +1
    26.7.2014 00:48 jadd | skóre: 34 | blog: Greenhorn
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    To patří tvůrcům, děkujem;) ovšem jestli je to řešení i pro tazatele, má vyšší prioritu.
    26.7.2014 01:11 jadd | skóre: 34 | blog: Greenhorn
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Ještě pro ilustraci, http://www.e-ott.info/2012/08/11/jak-najit-duplicitni-obrazky-a-odstranit-je-pomoci-gthumb-a-geeqie/gthumb-duplicity-vysledky

    Používá se obsah ale jestli byte-to-byte nebo hash spolehlivější než md5, to nevím. Mě to vždy našlo spolehlivě, přes počáteční nedůvěru.
    26.7.2014 11:20 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    No ne tak zcela. spíše hledám něco, co by spočetlo jen hashe a nemuselo vytvořit nějakých cca 2 000 000 thumbnailů. Navíc moje prostředí je KDE, tedy částečně bych to mohl vyřešit tím že vše zařadím do sbírek. ale to kde hledám duplicity nejsou to moje obrázky, ale třeba sbírka komixů a tím zahlcením digikamové databáze by se zpomalila práce s databází ve všech případech. Navíc další potenciální duplicity jsou v pdf a ppt souborech, což nevyřeší manager obrázků.
    26.7.2014 11:26 Kit | skóre: 37 | Brno
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    ZFS :-)
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    Petr Tomášek avatar 31.7.2014 17:44 Petr Tomášek | skóre: 36 | blog: Vejšplechty
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    A jak pomůže ZFS debordelizovat souborový systém? To je hezké, že to ZFS uloží jenom jednou, ale virtuálně ten bordel pro uživatele zůstane...
    Pavel 'TIGER' Růžička avatar 26.7.2014 11:38 Pavel 'TIGER' Růžička | skóre: 39
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Nebudu vypisovat již jednou napsané.
    27.7.2014 00:56 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Z toho odzaku jsem vycházel, než jsem se ptal. Už jsem spustil fdupes, pak mi došlo, že tak jako updatedb se to prostě dělat nedá. Protože při hledání duplicit musí se přečíst celý obsah disků, nejen adresářová struktura, což jsou u mne terabyty. Zatím fdupes běží 10 hodin a ještě není ve 1/4.
    27.7.2014 00:57 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    tedy odkazu. :-)
    27.7.2014 01:11 jadd | skóre: 34 | blog: Greenhorn
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    víš o tom že má volbu DIRECTORY atd.?
    27.7.2014 02:01 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Jo volba fdupes -r dir1 dir2 .... Probírám jen to co je namountováno v /mnt a /windows ani /home neprojíždím, protože to mám na SSD a tam ty duplikáty jsou pro rychlou práci.
    vandrovnik avatar 28.7.2014 10:15 vandrovnik | skóre: 16
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Když je to hledání dobře napsané, tak nemusí. Načte adresáře, srovná podle velikostí. Obsah souborů ho zajímá, jen když mají soubory shodnou velikost. A i pak lze číst po blocích a porovnávat, protože odlišnosti zpravidla budou i na začátku (nebude příliš běžné, aby u 100 GB souboru byl první rozdíl až někde v půlce apod.).
    28.7.2014 18:10 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Samozřejmě vše musí přečíst jen u těch skutečně duplikátních. Obávám se že jich mám hodně. po dvou dnech je výpočet v polovině.
    28.7.2014 21:38 axel
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Ze musi v pripade presne shody precist vsechno je asi zrejme. Takze pokud mas "terabyty" a je tam hodne shodnych, nemelo by te prekvapit, ze to bezi dlouho.
    29.7.2014 21:08 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    To nepřekvapilo tak moc. Už běh doběhl a ukazuje se, že duplikátů mám mnohem více než jsem si myslel. Výsledný formát má tvar
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/standa/PC090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/S3/PC090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_1_/1209-1846-St090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_2_/1209-1846-St090085.JPG
    
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/standa/PC090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/S3/PC090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_1_/1209-1845-St090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_2_/1209-1845-St090084.JPG
    
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/standa/PC090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/S3/PC090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_1_/1209-1846-St090085.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_2_/1209-1846-St090085.JPG
    
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/standa/PC090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky-zdroj/S3/PC090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_1_/1209-1845-St090084.JPG
    /windows/zaloha_2/z_externiho/__Movie____/_STANDA_Argentina/Argentina-fotky/Argentina-fotky_2_/1209-1845-St090084.JPG
    
    /windows/zaloha_2/Filmy/foto_zazalohovat/backup_/cfc-0012/dcim/165canon/mvi_6541.avi
    /windows/zaloha_2/Filmy/video/Radek/nezpracovano/CFC-0012/DCIM/165CANON/MVI_6541.AVI
    /mnt/crypted1/Foto/zpracovano/foto_zazalohovat/backup_/cfc-0012/dcim/165canon/mvi_6541.avi
    /mnt/afx/obrazky/Photo_original/2006/norsko/avi/norsko-20111207_4403_1.avi
    /mnt/basic/public/obrazky/obrazky/Photo_original/2006/norsko/avi/norsko-20111207_4403_1.avi
    /windows/zaloha_2/foto_zazalohovat/backup_/cfc-0012/dcim/165canon/mvi_6541.avi
    
    
    Tedy sada řádků s plnými názvy souborů, a každou skupinu stejných souborů odděluje jeden prázdný řádek. Soubor duplikátů je obrovský, takže ruční práce není možná. A pokouším se načíst, jak bych mohl dát dohromady script s následující funkcionalitou:
    1. Specifikuji adresář např /mnt/afx/obrazky/Photo_original a extenzi např. avi
    2. Skript se bude věnovat jen těm blokům duplikátů, v nichž najde soubor s specifikovanou počáteční cestou a extenzí.
    3. V příslušném bloku vezme všechny ostatní řádky přidá na jejich začátek "rm " a vloží je do souboru delete_duplicates.
    4. Pokud by se podařilo, aby současně vytvořil soubor duplicates_new, který by obsahoval původní soubor duplikátů s vyřazením těch bloků, které byly zpracovávány, dostal bych iterativní krok, který mi vytvoří přikaz, který převede situaci s nalezenými duplikáty ve stavu duplicates do stavu duplicates_new
    5. To, že někdy bych potřeboval, aby zbyly třeba dvě lokace umístění souborů už vyřeší grep -v /mnt/jiny/adresar na souboru delete_duplicates
    Ale to první nevím, myslím si, že by to mohlo snad jít s awk nebo sed, ale neznám je. Nebylo by nějaké nakopnutí?
    30.7.2014 14:06 Peter Golis | skóre: 54 | Bratislava
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    To vyzerá na výstup z fdupes, a ten má aj parametre --delete a --noempty. Ale s ním by som narával opatrne, napríklad multivolume archívy RAR zvyknú mať rovnaký MD5 checksum.
    30.7.2014 14:53 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Ano je to z fdupes, parametr --delete je k něčemu jen na jednoduché porovnání. v komplexnějším příkladu je třeba přesně specifikovat, které umístění nechat a které smazat a to v --delete není. (To, že multivolume archive má stejnou MD5 a přitom je různý velmi zpochybňuji. Sice na MD5 je možné vyrobit kolizi, ale dá to hodně práce.)
    30.7.2014 19:26 Peter Golis | skóre: 54 | Bratislava
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Ten argument delete som nepoužíval, radšej som to riešil ručne. Ale mal by biť popísaný.

    A s tým multivolume rar? Nejednalo sa o kolíziu ale o archív ktorý sa dal rozbaliť v prípade ak sa jedna z napríklad desiatich diskiet poškodila. V zarovnaní bloku sa dali doplniť hluché miesta údajmi. Kedysi, dávno pradávno som to používal. A ešte pred časom sa mi dostal do rúk podobný archív, len bol sekaný na cca 100M.
    30.7.2014 20:39 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    ten duplikátní soubor ze zpracování prostoru asi 10Tb má pře 1 500 000 řádků. ruční práce je vyloučena. Vzhledem k tomu že na dotaz nikdo nezareagoval tak to nějak vymyslím.

    A k hashi. Pokud mají dva soubory stejný hash jsou stejné. Platí to samozřejmě až té míry, že pokud je v hash funkci chyba, tak je možné cíleně vyvolat záměrnou kolizi. A tuhle vadu MD5 sice má, ale to se pro náhodně zmodifikovaný archiv neprojeví. Pouze v možnosti cíleného kolizního útoku ala Wang nebo Klima.
    31.7.2014 01:02 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Tak jsem splácal skript v perlu, který dělá přesně to, co jsem potřeboval.
    31.7.2014 09:55 alikarch | skóre: 10
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    tak šup sem s ním ne ?
    Petr Tomášek avatar 31.7.2014 18:53 Petr Tomášek | skóre: 36 | blog: Vejšplechty
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    To by mě taky zajímalo.
    6.8.2014 23:16 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Napíšu jak se vrátím z dovolené. systém je teď vypnutý.
    27.8.2014 16:54 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: efektivní hledání duplikátních souborů
    Řešení jsem blogoval tady

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.