Přihlášení | Registrace

napište » Zprávičky

inzerujte » Pracovní nabídky

Videozáznam z Czech Open Source Policy Forum 2024

dnes 14:22 | Komunita

Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

Ladislav Hagara | Komentářů: 0

Fossil 2.24

dnes 13:22 | Nová verze

Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

Ladislav Hagara | Komentářů: 0

Vivaldi 6.7

dnes 12:44 | Nová verze

Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

Ladislav Hagara | Komentářů: 0

Node.js 22

dnes 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

dnes 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

dnes 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

včera 22:44 | IT novinky

IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 12

TrueNAS SCALE 24.04 “Dragonfish”

včera 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Raspberry Pi Compute Module 4S s 2 GB, 4 GB a 8 GB paměti

včera 13:44 | IT novinky

Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

Ladislav Hagara | Komentářů: 0

nginx 1.26.0

včera 04:44 | Nová verze

Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (72%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (17%)

Celkem 751 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Automaticke porovnani a oznaceni odlisnosti v txt souboru

Štítky: cat, diff, skript

Dotaz: Automaticke porovnani a oznaceni odlisnosti v txt souboru

3.8.2012 15:05 tomes.io | skóre: 12 | blog: tomesh
Automaticke porovnani a oznaceni odlisnosti v txt souboru

Přečteno: 456×

Odpovědět | Admin

Ahoj,

mam dva textove soubory a oba potrebuju skriptem porovnat radek po radku tak, aby skript nestejne radky oznacil.

Tak me napadlo ze

 diff -c

oznaci radky, ktere jsou jine, vykricnikem:(!) na zacatku radku.

No a napadlo me brat dycky radek po radku z kazdeho souboru do nejakeho tmp (tmp='tmpfile' kvuli bezpecnosti), ty porovnat diffem, pokud je radek stejny, tak appendnout

>>

do tmp souboru, pokud je radek jiny, diff ho oznaci a taky (oznaveny) radek pripne do tmp soubor. Pak tmp prepise puvodni soubor.

Pseudoskript by vypadal nejak takto:

#!/bin/bash
while read line; do 
    echo $line > tmp          #vezme radek
                              #zde porovnava s druhym, ale jak, nejakou vhodnou funkci?
    cat tmp >> temporary      #pripina do dalsiho docasneho postupne radek po radku, vcetne oznacenych
done < "sample.txt"

Byl bych rad, kdyby me nekdo nakopnul spravnym smerem.

Řešení dotazu:

Nástroje: Začni sledovat (0) ?

Odpovědi

3.8.2012 15:26 NN
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Kvuli bezpecnosti brat radek po radku ?? Proc tedy neskopirovat rovnou cele soubory a porovnat je diffem ?

3.8.2012 17:26 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Sorry, tam melo byt kvuli bezpecnosti

tmpfile=`mktemp`

. Je lepsi pouzit mktemp nez vytvoreni noveho docasneho souboru (kvuli symlink vulnerability). Pro potreby pseudokodu je to vsak irelevantni (navic mktemp umozni bezproblemove spusteni skriptu na jednom pocitaci vicekrat).

Kdyby slo porovnat soubory diffem tak, aby mi tako vystup hodil jiz oznacene soubory, bylo by to fajn. Ale nevim, jak to udelat, nikde jsem takovou moznost nevygooglil, proto me napadl ten postup s porovnanim radek po radku.

Zkratka, kdyz mam v jednom souboru:

aaaaa
bbbbb

a v druhem:

aaaaa
ccccc

tak chci, aby vystup skriptu byly soubory, ve kterych by byly nejak oznacene radky, ktere se neshoduji, napr v prvnim souborU:

aaaaa
(!)bbbbb

v druhem:

aaaaa
(!)ccccc

3.8.2012 18:59 Patrik Uhrak | skóre: 31 | blog: pato
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

#! /bin/bash

input1="$1"
input2="$2"

while read line
do
        if grep -e "$line" "$input2" &>/dev/null
        then
                sed -i "s/$line/\!$line/" "$input1" "$input2"
        fi 
done <./"$input1"

Ako zaklad by to mohlo byt. Docasnymi subormi by som sa netrapil, iba to komplikuje vec. Staci spravit zalohu originalu pre spustenim skriptu.

3.8.2012 19:03 Patrik Uhrak | skóre: 31 | blog: pato
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Treba opravit sed, lebo v danom skripte pri prvej zhode konci. Spravne to ma byt:

sed -i "s/$line/\!$line/g" "$input1" "$input2"

7.8.2012 09:31 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Super, tohle me docela nakoplo, zbytek vyzjistim uz z manualu. Diky.

8.8.2012 14:33 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

No tak to jako zaklad reseni selhava. neuvedomil jsem si, ze ten while bere pouze jeden radek z prvniho souboru.

Prochazi WHILE soubor1, ale co ten soubor2? ten prece neprochazi radek po radku... Skript zkratka neudela vybec nic... neco jsem prehledl? Skrze ten cyklus to asi nepujde...

8.8.2012 15:10 Patrik Uhrak | skóre: 31 | blog: pato
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Aj ste to skusali spustit ??? Bo robi to, co ste chceli. Ak porovnavam dva subory a hladam zhodu, tak ak sa prejde cely prvy subor riadok po riadku, tak nie je dovod kontrolovat kazdy riadok z druheho a porovnavat s riadkami v prvom subore.

Vid ukazku:

#! /bin/bash
 
input1="$1"
input2="$2"
 
while read line
do
        if grep -w -e "$line" "$input2" &>/dev/null
        then
                sed -i "s/$line/\!$line/" "$input1" "$input2"
        fi
done <"$input1"

test2.file

aaaaa
fdsafasdsdafbbbbb
cccccsfdsfsd
fffffff
gggggasfsdf
hjlkk
ewiorjodsfsdfsdf
ad;kl
jlkfsfafaf
xxxxxxdfsdfaf

test1.file

aaaaa
bbbbb
ccccc
fffffff
ggggg
hjlkk
ewiorjo
ad;kl
jlk
xxxxxx

Po spusteni skriptu je vysledok nasledovny:

Lucias-MacBook-Pro:~ lucka$ grep -n ^! test*.file
test1.file:1:!aaaaa
test1.file:2:!bbbbb
test1.file:4:!fffffff
test1.file:6:!h!jlkk
test1.file:8:!ad;kl
test2.file:1:!aaaaa
test2.file:4:!fffffff
test2.file:6:!h!jlkk
test2.file:8:!ad;kl
Lucias-MacBook-Pro:~ lucka$ grep -v -n ^! test*.file
test1.file:3:ccccc
test1.file:5:ggggg
test1.file:7:ewiorjo
test1.file:9:jlk
test1.file:10:xxxxxx
test2.file:2:fdsafasdsdaf!!bbbbb
test2.file:3:cccccsfdsfsd
test2.file:5:gggggasfsdf
test2.file:7:ewiorjodsfsdfsdf
test2.file:9:jlkfsfafaf
test2.file:10:xxxxxxdfsdfaf

Subory vyzeraju samozrejme inak, len som chcel ukazat zhody osve od riadkov, kde ku zhodam nedoslo, aby si si to mohol porovnat a videl dovod, preco je iba mrhanim prostriedkov konat inak.

8.8.2012 19:08 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Jasneze jsem to zkousel :) Ale v praci na win pres cygwin. Doma na Fedore to pracuje, takze se omlouvam za paniku. Fakt jsem myslel, ze je to ve spatnem cyklu . Takze uz to jede, sice to oznacuje shodne radky (chtel jsem neshodne) ale to je uz malickost.

Horsi je, ze sed ma evifentne problem s tagy. Ja potrebuji takto porovnavat a oznacovat soubory, ktere maji jednu vetuna kazdem radku a kazda veta zacina < s > a konci < lomitko s>. Pdobne, jako mi zdejsi diskuse nepovoli ukoncovaci tag a musel jsem napsat slovy "lomitko" tak sed s tim ma taky problem:

sed: -e expression #1, char 47: unknown option to `s'
sed: -e expression #1, char 40: unknown option to `s'
sed: -e expression #1, char 44: unknown option to `s'
sed: -e expression #1, char 51: unknown option to `s'

Jeda se vzdy o ukoncovaci tagy.

Da se tohle nejak obejit?

8.8.2012 22:10 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Proč neukážete i ten příkaz, který jste zkoušel? Takhle můžu jen hádat: tipuji problém s lomítkem, které bylo vyhodnoceno jako oddělovač, takže následující "s" sed chápal jako (neznámou) option. Je-li to tak, buď před to lomítko, které má být součástí vzorku, dejte backslash, nebo použijte jiný oddělovač, který nemáte ve vzorku ani v replacement textu.

8.8.2012 23:43 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Jaky prikaz mate na mysli? Spusteni skriptu? Ten povazuji za zrejmy:

]$ ./compare.sh file1.txt file2.txt
sed: -e expression #1, char 84: unknown option to `s'
sed: -e expression #1, char 28: unknown option to `s'
sed: -e expression #1, char 74: unknown option to `s'

Poukazuji na to, ze problem je v samotnych textovych souborech, ktere obsahuji tagy.

Vypada to nejak takto:

<s> veta </s>
<s>druha veta </s>

Soubory samotne modifikovat modifikovat nijak nemuzu, format vety uzavrenych mezi tagy musi zustat zachovan.

8.8.2012 23:44 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Snad by slo misto sed vyuzit awk.

9.8.2012 06:40 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Jaky prikaz mate na mysli? Spusteni skriptu?

Ne, pochopitelně příkaz sed, který vám tu chybu hlásí. Bez toho, abyste ukázal, s jakými parametry ho voláte, můžu jen hádat naslepo.

9.8.2012 07:10 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Aha, on je to ten skript výše. Tak lomítko by ještě šlo ošetřit pomocí

  sed -e "s/^${line//\//\\/}$/\!&/"

(stříška a dolar jsou nutné, aby to nenašlo i řádky, které obsahují řádek z prvního souboru jako podřetězec), ale stejně tam budou dělat problémy všechny ostatní konstrukce regulárních výrazů, např. tečka. Další chyba je v použití "read line", které odstraní počáteční a koncové mezery. A konečně se při upravování druhého souboru mění soubor, vůči kterému porovnáváme další řádky. Takže když už to dělat takhle, tak spíš

#!/bin/bash

matches1=`mktemp`
matches2=`mktemp`

i=1
while read; do
    line="$REPLY"

     j=1
     while read; do
         if [ "$line" = "$REPLY" ]; then
             echo $i >>"$matches1"
             echo $j >>"$matches2"
         fi
         : $[j++]
     done <"$2"

    : $[i++]
done <"$1"

aux=`mktemp`
prev=0
exec 3<"$1"
sort -n -u "$matches1" | while read next; do
    for ((i=prev; i<next; i++)); do
         read <&3
         echo "$REPLY" >>"$aux"
    done
    read <&3
    echo "!$REPLY" >>"$aux"
done
rm -f "$matches1"
mv -f "$aux" "$1"

aux=`mktemp`
prev=0
exec 3<"$2"
sort -n -u "$matches2" | while read next; do
    for ((i=prev; i<next; i++)); do
         read <&3
         echo "$REPLY" >>"$aux"
    done
    read <&3
    echo "!$REPLY" >>"$aux"
done
rm -f "$matches2"
mv -f "$aux" "$2"

(píšu to z hlavy a nemám čas to zkoušet, takže tam asi budou nějaké chybičky)

13.8.2012 21:23 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

No nakonec to slo vyresit bez lomitek:

sed -i "s#$line#!$line#g" "$input1" "$input2"

A zda se, ze to dela co potrebuju.

14.8.2012 00:13 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Jen dokud tam někde nebude křížek.

14.8.2012 00:19 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

…nebo kterýkoli znak nebo kombinace znaků, které mají v regulárních výrazech speciální význam. A samozřejmě to bude matchovat i podřetězce.

Gratuluji, podařilo se vám úspěšně ignorovat všechno, co jsem napsal ve svém příspěvku. Hlavně že jste si to označil jako řešení…

14.8.2012 13:46 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Tam budou jen normalni ceske vety uzavrene vyse zminenymi tagy. A prave ty tagy, resp. backslash delaly problemy. Krizky ani jine regularnevyrazove tam nebudou...

ja dekuji za pomoc, ale moje reseni resi co ja potrebuji. nemusim osetrovat uplne vsechny pripady a moznosti. Pokud Vam to vadi, muzu se odznacit a jako reseni oznacit Vas prispevek... ja jen rikam, ze co jsem chtel, to jsem dostal..

14.8.2012 13:55 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

navic Vase reseni zavorek:

sed -e "s/^${line//\//\\/}$/\!&/"

nefunguje. Skript neudela nic, nic neoznaci.

14.8.2012 14:06 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Mně to funguje:

mike@unicorn:~> line=x/y
mike@unicorn:~> sed -e "s/^${line//\//\\/}$/\!&/" <<EOT
ax/yb
x/y
xy
EOT                                                                             
ax/yb                                                                           
!x/y                                                                            
xy

3.8.2012 23:12 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Mám nejasné tušení, že hledáte příkaz comm (ale pozor, funguje jen na seřazené soubory).

3.8.2012 20:53 Kit
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Opět mám tušení, že tady někdo vynalézá kolo, když si může z garáže vytáhnout auto. Když nám prozradíš, k čemu to potřebuješ, tak ti možná poradíme nějaký verzovací systém, který tvůj problém vyřeší komplexně.

3.8.2012 23:56 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Ja to dostal zkratka jako zadani ukolu pro skolni laborator... Rozkaz znel jasne: musi to byt bash script (verzovaci system tedy nepomuze) na porovnani textu (nejlepe schopny zpracovavat vice nez dva soubory zaraz) ktery bude nejak oznacovat vety/radky, ktere se neshoduji (vsechny texty jsem si uz predtim jinym skriptem upravil tak, aby 1 radka = 1 veta.

4.8.2012 00:11 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Aha, takže domácí úkol. :-(

4.8.2012 00:34 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru

Dobrovolny ukol, nikoliv klasicky domaci. Koneckoncu jsou prazdniny, jenom ja blbec se chci neco porad ucit a delat ;) Proc ten smajlik, je na tom neco spatneho? Psal jsem, ze chci nakopnout, ne aby to za me nekdo vyresil (to bych se toho s takovou asi moc nenaucil, i kdyz jedna z cest jak se neco naucit je pry cist programy po druhych :)

8.8.2012 15:44 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: Automaticke porovnani a oznaceni odlisnosti v txt souboru