abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:11 | IT novinky

    Chris Kühl (CEO), Christian Brauner (CTO) a Lennart Poettering (Chief Engineer) představili svou společnost Amutable. Má přinést determinismus a ověřitelnou integritu do linuxových systémů.

    Ladislav Hagara | Komentářů: 1
    včera 20:11 | Nová verze

    Byla vydána (𝕏) nová verze 26.1 open source firewallové a routovací platformy OPNsense (Wikipedie). Jedná se o fork pfSense postavený na FreeBSD. Kódový název OPNsense 26.1 je Witty Woodpecker. Přehled novinek v příspěvku na fóru.

    Ladislav Hagara | Komentářů: 2
    včera 15:11 | Zajímavý projekt

    Deník TO spustil vlastní zpravodajský webový portál ToHledej.CZ s internetovým vyhledávačem a bezplatnou e-mailovou schránkou. Dle svého tvrzení nabízí 'Zprávy, komentáře, analýzy bez cenzury' a 'Mail bez šmírování a Velkého bratra'. Rozložením a vizuálním stylem se stránky nápadně podobají portálu Seznam.cz a nejspíše je cílem být jeho alternativou. Z podmínek platformy vyplývá, že portál využívá nespecifikovaný internetový vyhledávač třetí strany.

    NUKE GAZA! 🎆 | Komentářů: 14
    včera 14:11 | Zajímavý projekt

    Computer History Museum (Muzeum historie počítačů) zpřístupnilo své sbírky veřejnosti formou online katalogu. Virtuálně si tak můžeme prohlédnout 'rozsáhlou sbírku archivních materiálů, předmětů a historek a seznámit se s vizionáři, inovacemi a neznámými příběhy, které revolučním způsobem změnily náš digitální svět'.

    NUKE GAZA! 🎆 | Komentářů: 5
    včera 14:00 | Zajímavý projekt

    Ruský hacker VIK-on si sestavil vlastní 32GB DDR5 RAM modul z čipů získaných z notebookových 16GB SO-DIMM RAM pamětí. Modul běží na 6400 MT/s a celkové náklady byly přibližně 218 dolarů, což je zhruba třetina současné tržní ceny modulů srovnatelných parametrů.

    NUKE GAZA! 🎆 | Komentářů: 12
    včera 11:00 | Upozornění

    Národní identitní autorita (NIA), která ovlivňuje přihlašování prostřednictvím NIA ID, MEP, eOP a externích identit (např. BankID), je částečně nedostupná.

    Ladislav Hagara | Komentářů: 9
    včera 02:44 | Nová verze

    Byla vydána nová verze 1.16.0 klienta a serveru VNC (Virtual Network Computing) s názvem TigerVNC (Wikipedie). Z novinek lze vypíchnout nový server w0vncserver pro sdílení Wayland desktopu. Zdrojové kódy jsou k dispozici na GitHubu. Binárky na SourceForge. TigerVNC je fork TightVNC.

    Ladislav Hagara | Komentářů: 0
    27.1. 14:44 | Nová verze

    Byla vydána nová verze 4.6 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    27.1. 13:33 | Humor

    Rozsáhlá modernizace hardwarové infrastruktury Základních registrů měla zabránit výpadkům digitálních služeb státu. Dnešnímu výpadku nezabránila.

    Ladislav Hagara | Komentářů: 11
    27.1. 13:11 | Nová verze

    Čínský startup Kimi představil open-source model umělé inteligence Kimi K2.5. Nová verze pracuje s textem i obrázky a poskytuje 'paradigma samosměřovaného roje agentů' pro rychlejší vykonávání úkolů. Kimi zdůrazňuje vylepšenou schopnost modelu vytvářet zdrojové kódy přímo z přirozeného jazyka. Natrénovaný model je dostupný na Hugging Face, trénovací skripty však ne. Model má 1 T (bilion) parametrů, 32 B (miliard) aktivních.

    NUKE GAZA! 🎆 | Komentářů: 16
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (10%)
     (23%)
     (3%)
     (5%)
     (2%)
     (12%)
     (33%)
    Celkem 655 hlasů
     Komentářů: 19, poslední včera 13:03
    Rozcestník

    Dotaz: Automaticke porovnani a oznaceni odlisnosti v txt souboru

    tomes.io avatar 3.8.2012 15:05 tomes.io | skóre: 12 | blog: tomesh
    Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Přečteno: 483×
    Ahoj,

    mam dva textove soubory a oba potrebuju skriptem porovnat radek po radku tak, aby skript nestejne radky oznacil.

    Tak me napadlo ze
     diff -c 
    oznaci radky, ktere jsou jine, vykricnikem:(!) na zacatku radku.

    No a napadlo me brat dycky radek po radku z kazdeho souboru do nejakeho tmp (tmp='tmpfile' kvuli bezpecnosti), ty porovnat diffem, pokud je radek stejny, tak appendnout
    >>
    do tmp souboru, pokud je radek jiny, diff ho oznaci a taky (oznaveny) radek pripne do tmp soubor. Pak tmp prepise puvodni soubor.

    Pseudoskript by vypadal nejak takto:
    #!/bin/bash
    while read line; do 
        echo $line > tmp          #vezme radek
                                  #zde porovnava s druhym, ale jak, nejakou vhodnou funkci?
        cat tmp >> temporary      #pripina do dalsiho docasneho postupne radek po radku, vcetne oznacenych
    done < "sample.txt"
    Byl bych rad, kdyby me nekdo nakopnul spravnym smerem.


    Řešení dotazu:


    Odpovědi

    3.8.2012 15:26 NN
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Kvuli bezpecnosti brat radek po radku ?? Proc tedy neskopirovat rovnou cele soubory a porovnat je diffem ?
    tomes.io avatar 3.8.2012 17:26 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Sorry, tam melo byt kvuli bezpecnosti
    tmpfile=`mktemp`
    . Je lepsi pouzit mktemp nez vytvoreni noveho docasneho souboru (kvuli symlink vulnerability). Pro potreby pseudokodu je to vsak irelevantni (navic mktemp umozni bezproblemove spusteni skriptu na jednom pocitaci vicekrat).

    Kdyby slo porovnat soubory diffem tak, aby mi tako vystup hodil jiz oznacene soubory, bylo by to fajn. Ale nevim, jak to udelat, nikde jsem takovou moznost nevygooglil, proto me napadl ten postup s porovnanim radek po radku.

    Zkratka, kdyz mam v jednom souboru:
    aaaaa
    bbbbb
    a v druhem:
    aaaaa
    ccccc
    tak chci, aby vystup skriptu byly soubory, ve kterych by byly nejak oznacene radky, ktere se neshoduji, napr v prvnim souborU:
    aaaaa
    (!)bbbbb
    v druhem:
    aaaaa
    (!)ccccc
    3.8.2012 18:59 Patrik Uhrak | skóre: 31 | blog: pato
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    #! /bin/bash
    
    input1="$1"
    input2="$2"
    
    while read line
    do
            if grep -e "$line" "$input2" &>/dev/null
            then
                    sed -i "s/$line/\!$line/" "$input1" "$input2"
            fi 
    done <./"$input1"
    

    Ako zaklad by to mohlo byt. Docasnymi subormi by som sa netrapil, iba to komplikuje vec. Staci spravit zalohu originalu pre spustenim skriptu.

    3.8.2012 19:03 Patrik Uhrak | skóre: 31 | blog: pato
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

    Treba opravit sed, lebo v danom skripte pri prvej zhode konci. Spravne to ma byt:

    sed -i "s/$line/\!$line/g" "$input1" "$input2"
    tomes.io avatar 7.8.2012 09:31 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Super, tohle me docela nakoplo, zbytek vyzjistim uz z manualu. Diky.
    tomes.io avatar 8.8.2012 14:33 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    No tak to jako zaklad reseni selhava. neuvedomil jsem si, ze ten while bere pouze jeden radek z prvniho souboru.

    Prochazi WHILE soubor1, ale co ten soubor2? ten prece neprochazi radek po radku... Skript zkratka neudela vybec nic... neco jsem prehledl? Skrze ten cyklus to asi nepujde...
    8.8.2012 15:10 Patrik Uhrak | skóre: 31 | blog: pato
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

    Aj ste to skusali spustit ??? Bo robi to, co ste chceli. Ak porovnavam dva subory a hladam zhodu, tak ak sa prejde cely prvy subor riadok po riadku, tak nie je dovod kontrolovat kazdy riadok z druheho a porovnavat s riadkami v prvom subore.

    Vid ukazku:

    #! /bin/bash
     
    input1="$1"
    input2="$2"
     
    while read line
    do
            if grep -w -e "$line" "$input2" &>/dev/null
            then
                    sed -i "s/$line/\!$line/" "$input1" "$input2"
            fi
    done <"$input1"
    

    test2.file

    aaaaa
    fdsafasdsdafbbbbb
    cccccsfdsfsd
    fffffff
    gggggasfsdf
    hjlkk
    ewiorjodsfsdfsdf
    ad;kl
    jlkfsfafaf
    xxxxxxdfsdfaf
    

    test1.file

    aaaaa
    bbbbb
    ccccc
    fffffff
    ggggg
    hjlkk
    ewiorjo
    ad;kl
    jlk
    xxxxxx
    

    Po spusteni skriptu je vysledok nasledovny:

    Lucias-MacBook-Pro:~ lucka$ grep -n ^! test*.file
    test1.file:1:!aaaaa
    test1.file:2:!bbbbb
    test1.file:4:!fffffff
    test1.file:6:!h!jlkk
    test1.file:8:!ad;kl
    test2.file:1:!aaaaa
    test2.file:4:!fffffff
    test2.file:6:!h!jlkk
    test2.file:8:!ad;kl
    Lucias-MacBook-Pro:~ lucka$ grep -v -n ^! test*.file
    test1.file:3:ccccc
    test1.file:5:ggggg
    test1.file:7:ewiorjo
    test1.file:9:jlk
    test1.file:10:xxxxxx
    test2.file:2:fdsafasdsdaf!!bbbbb
    test2.file:3:cccccsfdsfsd
    test2.file:5:gggggasfsdf
    test2.file:7:ewiorjodsfsdfsdf
    test2.file:9:jlkfsfafaf
    test2.file:10:xxxxxxdfsdfaf
    

    Subory vyzeraju samozrejme inak, len som chcel ukazat zhody osve od riadkov, kde ku zhodam nedoslo, aby si si to mohol porovnat a videl dovod, preco je iba mrhanim prostriedkov konat inak.

    tomes.io avatar 8.8.2012 19:08 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Jasneze jsem to zkousel :) Ale v praci na win pres cygwin. Doma na Fedore to pracuje, takze se omlouvam za paniku. Fakt jsem myslel, ze je to ve spatnem cyklu . Takze uz to jede, sice to oznacuje shodne radky (chtel jsem neshodne) ale to je uz malickost.

    Horsi je, ze sed ma evifentne problem s tagy. Ja potrebuji takto porovnavat a oznacovat soubory, ktere maji jednu vetuna kazdem radku a kazda veta zacina < s > a konci < lomitko s>. Pdobne, jako mi zdejsi diskuse nepovoli ukoncovaci tag a musel jsem napsat slovy "lomitko" tak sed s tim ma taky problem:
    sed: -e expression #1, char 47: unknown option to `s'
    sed: -e expression #1, char 40: unknown option to `s'
    sed: -e expression #1, char 44: unknown option to `s'
    sed: -e expression #1, char 51: unknown option to `s'
    
    Jeda se vzdy o ukoncovaci tagy.

    Da se tohle nejak obejit?
    8.8.2012 22:10 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Proč neukážete i ten příkaz, který jste zkoušel? Takhle můžu jen hádat: tipuji problém s lomítkem, které bylo vyhodnoceno jako oddělovač, takže následující "s" sed chápal jako (neznámou) option. Je-li to tak, buď před to lomítko, které má být součástí vzorku, dejte backslash, nebo použijte jiný oddělovač, který nemáte ve vzorku ani v replacement textu.
    tomes.io avatar 8.8.2012 23:43 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Jaky prikaz mate na mysli? Spusteni skriptu? Ten povazuji za zrejmy:
    ]$ ./compare.sh file1.txt file2.txt
    sed: -e expression #1, char 84: unknown option to `s'
    sed: -e expression #1, char 28: unknown option to `s'
    sed: -e expression #1, char 74: unknown option to `s'
    
    Poukazuji na to, ze problem je v samotnych textovych souborech, ktere obsahuji tagy.

    Vypada to nejak takto:
    <s> veta </s>
    <s>druha veta </s>
    
    
    Soubory samotne modifikovat modifikovat nijak nemuzu, format vety uzavrenych mezi tagy musi zustat zachovan.

    tomes.io avatar 8.8.2012 23:44 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Snad by slo misto sed vyuzit awk.
    9.8.2012 06:40 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Jaky prikaz mate na mysli? Spusteni skriptu?

    Ne, pochopitelně příkaz sed, který vám tu chybu hlásí. Bez toho, abyste ukázal, s jakými parametry ho voláte, můžu jen hádat naslepo.

    9.8.2012 07:10 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Aha, on je to ten skript výše. Tak lomítko by ještě šlo ošetřit pomocí
      sed -e "s/^${line//\//\\/}$/\!&/"
    
    (stříška a dolar jsou nutné, aby to nenašlo i řádky, které obsahují řádek z prvního souboru jako podřetězec), ale stejně tam budou dělat problémy všechny ostatní konstrukce regulárních výrazů, např. tečka. Další chyba je v použití "read line", které odstraní počáteční a koncové mezery. A konečně se při upravování druhého souboru mění soubor, vůči kterému porovnáváme další řádky. Takže když už to dělat takhle, tak spíš
    #!/bin/bash
    
    matches1=`mktemp`
    matches2=`mktemp`
    
    i=1
    while read; do
        line="$REPLY"
    
         j=1
         while read; do
             if [ "$line" = "$REPLY" ]; then
                 echo $i >>"$matches1"
                 echo $j >>"$matches2"
             fi
             : $[j++]
         done <"$2"
    
        : $[i++]
    done <"$1"
    
    aux=`mktemp`
    prev=0
    exec 3<"$1"
    sort -n -u "$matches1" | while read next; do
        for ((i=prev; i<next; i++)); do
             read <&3
             echo "$REPLY" >>"$aux"
        done
        read <&3
        echo "!$REPLY" >>"$aux"
    done
    rm -f "$matches1"
    mv -f "$aux" "$1"
    
    aux=`mktemp`
    prev=0
    exec 3<"$2"
    sort -n -u "$matches2" | while read next; do
        for ((i=prev; i<next; i++)); do
             read <&3
             echo "$REPLY" >>"$aux"
        done
        read <&3
        echo "!$REPLY" >>"$aux"
    done
    rm -f "$matches2"
    mv -f "$aux" "$2"
    
    

    (píšu to z hlavy a nemám čas to zkoušet, takže tam asi budou nějaké chybičky)

    tomes.io avatar 13.8.2012 21:23 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    No nakonec to slo vyresit bez lomitek:
    sed -i "s#$line#!$line#g" "$input1" "$input2"
    A zda se, ze to dela co potrebuju.
    14.8.2012 00:13 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Jen dokud tam někde nebude křížek.
    14.8.2012 00:19 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

    …nebo kterýkoli znak nebo kombinace znaků, které mají v regulárních výrazech speciální význam. A samozřejmě to bude matchovat i podřetězce.

    Gratuluji, podařilo se vám úspěšně ignorovat všechno, co jsem napsal ve svém příspěvku. Hlavně že jste si to označil jako řešení…

    tomes.io avatar 14.8.2012 13:46 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Tam budou jen normalni ceske vety uzavrene vyse zminenymi tagy. A prave ty tagy, resp. backslash delaly problemy. Krizky ani jine regularnevyrazove tam nebudou...

    ja dekuji za pomoc, ale moje reseni resi co ja potrebuji. nemusim osetrovat uplne vsechny pripady a moznosti. Pokud Vam to vadi, muzu se odznacit a jako reseni oznacit Vas prispevek... ja jen rikam, ze co jsem chtel, to jsem dostal..
    tomes.io avatar 14.8.2012 13:55 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    navic Vase reseni zavorek:
    sed -e "s/^${line//\//\\/}$/\!&/"
    nefunguje. Skript neudela nic, nic neoznaci.

    14.8.2012 14:06 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

    Mně to funguje:

    mike@unicorn:~> line=x/y
    mike@unicorn:~> sed -e "s/^${line//\//\\/}$/\!&/" <<EOT
    ax/yb
    x/y
    xy
    EOT                                                                             
    ax/yb                                                                           
    !x/y                                                                            
    xy                                                                              
    
    3.8.2012 23:12 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Mám nejasné tušení, že hledáte příkaz comm (ale pozor, funguje jen na seřazené soubory).
    3.8.2012 20:53 Kit
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Opět mám tušení, že tady někdo vynalézá kolo, když si může z garáže vytáhnout auto. Když nám prozradíš, k čemu to potřebuješ, tak ti možná poradíme nějaký verzovací systém, který tvůj problém vyřeší komplexně.
    tomes.io avatar 3.8.2012 23:56 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Ja to dostal zkratka jako zadani ukolu pro skolni laborator... Rozkaz znel jasne: musi to byt bash script (verzovaci system tedy nepomuze) na porovnani textu (nejlepe schopny zpracovavat vice nez dva soubory zaraz) ktery bude nejak oznacovat vety/radky, ktere se neshoduji (vsechny texty jsem si uz predtim jinym skriptem upravil tak, aby 1 radka = 1 veta.
    4.8.2012 00:11 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Aha, takže domácí úkol. :-(
    tomes.io avatar 4.8.2012 00:34 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Dobrovolny ukol, nikoliv klasicky domaci. Koneckoncu jsou prazdniny, jenom ja blbec se chci neco porad ucit a delat ;) Proc ten smajlik, je na tom neco spatneho? Psal jsem, ze chci nakopnout, ne aby to za me nekdo vyresil (to bych se toho s takovou asi moc nenaucil, i kdyz jedna z cest jak se neco naucit je pry cist programy po druhych :)
    8.8.2012 15:44 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru
    Psal jsem, ze chci nakopnout
    V tom případě použij oblíbený vyhledávač a zadej "bash mapfile" - ale raději si ověř, že v zadání bylo bash skript.
    When your hammer is C++, everything begins to look like a thumb.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.