abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:33 | Humor

    Je tu opět apríl. O víkendu zmizel kamion s 12 tunami tyčinek KitKat. Firmy to využívají k aprílovým žertům. Groupon má super akci. Koupíte 1 tyčinku a dostanete 100 zdarma. Ryanair si přelepil letadla. Šéf Outlooku se ptá, proč mají v baráku 14 beden tyčinek KitKat (𝕏). Prusa Research představuje Prusa Pro ACU a vysvětluje proč přílišné sušení škodí vaším filamentům. Telefon Sony Xperia má miliónnásobný zoom (𝕏). PC.net představil Super Ultrabox 2600 se zajímavými parametry. Další aprílové novinky například na April Fools' Day On The Web.

    Ladislav Hagara | Komentářů: 2
    dnes 13:22 | IT novinky

    Společnost OpenAI, která stojí za chatovacím robotem s umělou inteligencí (AI) ChatGPT, získala od investorů 122 miliard USD (2,6 bilionu Kč). Hodnota společnosti tak dosáhla 852 miliard dolarů (více než 18 bilionů Kč). Nejnovější kolo investování se stalo největší, jaké zatím firma uskutečnila, a peníze mají posílit ambiciózní plány rozšíření výpočetní kapacity, datových center a nábor talentů.

    Ladislav Hagara | Komentářů: 3
    dnes 13:11 | IT novinky

    Nástroj k identifikaci občanů v on-line komunikaci s úřady byl dnes dopoledne zhruba dvě hodiny částečně nedostupný. Problém se objevil kolem 09:00 a podařilo se ho vyřešit kolem 11:00. Částečně nedostupná byla služba Národní identitní autority (NIA), problémy podle DIA (Digitální a informační agentura) ovlivňovaly přihlašování například i přes bankovní identitu. „Dostupnost NIA byla plně obnovena, přihlášení k digitálním službám

    … více »
    Ladislav Hagara | Komentářů: 2
    dnes 13:00 | IT novinky

    Eben Upton oznámil další zdražení počítačů Raspberry Pi kvůli růstu cen pamětí a představil Raspberry Pi 4 s 3 GB RAM za 83,75 dolarů.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Humor

    Anthropic patrně omylem zveřejnil celý zdrojový kód svého CLI nástroje Claude Code prostřednictvím přiloženého sourcemap souboru v npm balíčku. Únik odhalil doposud nijak nezveřejněné funkce jako je například režim v utajení, autonomní agent 'KAIROS', orchestrace multi‑agentů, režim snění nebo dokonce virtuální mazlíček Buddy. Zajímavostí je detekce naštvání uživatele pomocí obyčejného regexpu. Anthropic rychle odstranil sourcemap a vydal opravu, nicméně kopie kódu se již stihly na GitHubu rozšířit mezi prostým lidem.

    NUKE GAZA! 🎆 | Komentářů: 9
    včera 14:33 | Humor

    Copilot automaticky vkládal do pull requestů 'propagační tipy', reklamní text se na GitHubu objevil ve více než jedenácti tisících pull requestech. Po vlně kritiky byla tato funkce zablokována a produktový manažer Tim Rogers připustil, že umožnit Copilotovi upravovat cizí pull requesty bez vědomí autorů byla chyba.

    NUKE GAZA! 🎆 | Komentářů: 4
    včera 12:55 | Upozornění

    Je 31. března a tedy Světový den zálohování (World Backup Day). Co by se stalo, kdyby Vám právě teď odešel počítač, tablet nebo telefon, který používáte?

    Ladislav Hagara | Komentářů: 4
    včera 12:44 | Upozornění

    Digitální a informační agentura (DIA) přistupuje ke změně formátu důvěryhodného seznamu České republiky z verze TLv5 na verzi TLv6, která nastane 29. dubna 2026 v 00:00 (CET). Ke změně formátu důvěryhodných seznamů členských států (tzv. Trusted Lists) dochází na základě změn příslušné unijní legislativy. Důvěryhodné seznamy se používají v rámci informačních systémů a aplikací zejména pro účely ověřování platnosti elektronických

    … více »
    Ladislav Hagara | Komentářů: 2
    včera 05:00 | Nová verze

    Rspamd (Wikipedie), tj. open source systému pro filtrování nevyžádané pošty, byl vydán v nové major verzi 4.0.0. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 1
    30.3. 23:11 | Nová verze

    SolveSpace (Wikipedie), tj. multiplatformní open source parametrický 2D/3D CAD, byl vydán v nové verzi 3.2. Přehled novinek v Changelogu na GitHubu. Vyzkoušet lze novou oficiální webovou verzi.

    Ladislav Hagara | Komentářů: 10
    Které desktopové prostředí na Linuxu používáte?
     (15%)
     (7%)
     (1%)
     (12%)
     (30%)
     (3%)
     (5%)
     (1%)
     (14%)
     (23%)
    Celkem 1202 hlasů
     Komentářů: 29, poslední včera 11:17
    Rozcestník

    Dotaz: rychlost skriptu na debian amd64 vs. gentoo

    30.4.2007 14:01 hajoucha | skóre: 22
    rychlost skriptu na debian amd64 vs. gentoo
    Přečteno: 313×

    Dobrý den

    mám následující skript:

    #!/bin/bash
    
    FILE=`basename $1 .out`
    
    grep "TEMP_HOT" $1 | awk '{print $1, $3}' > $FILE.temp
    grep "TEMP_COLD" $1 | awk '{print $1, $3}' > $FILE.cold
    grep "CURRENT" $1 | awk '{print $1, $3}' > $FILE.curr
    sed '/Time/!d; /???/d;' $1 |cut -d : -f 2- |sed 's/:/ /g' |awk '{print $1, $3, $5, $7}' |sort -n |uniq > $FILE.fin
    echo "hotovo sefe!"
    
    exit 0
    
    ten pouštím na soubor, který má cca 200MiB. Na stanici s debianem amd64 (2GiB RAM) s procesorem :
    model name      : AMD Athlon(tm) 64 X2 Dual Core Processor 5600+
    stepping        : 3
    cpu MHz         : 2812.829
    cache size      : 1024 KB
    
    trvá
    
    real    1m12.978s
    user    1m23.369s
    sys     0m1.752s
    
    
    kdežto na stanici s gentoo (zrejme 32bit, 1GiB RAM) s procesorem
    model name      : AMD Athlon(tm) 64 Processor 3500+
    stepping        : 0
    cpu MHz         : 2203.408
    cache size      : 512 KB
    
    
    trvá:
    real    0m26.438s
    user    0m23.921s
    sys     0m1.736s
    
    
    Ani jeden stroj není jinými procesy nijak zatížen. Liší se pouze verze "sort" a "uniq". Gentoo má 6.4 vs. debianí 5.97. Ale i přesto... vysvětluje to tak závratný rozdíl v časech při takovém rozdílu hw? Zdrojová data jsou k mání třeba zde: data

    Pozn: ten skript odpovídá mým skromným znalostem..., takže případná zlepšení jsou samozřejmě vítána :)

    Odpovědi

    30.4.2007 14:32 Ash
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    Zásadní rozdíl v rychlosti u sort/uniq by mohlo způsobovat UTF8. LANG=C sort to přepnete do ascii. Není to ten důvod?
    30.4.2007 14:43 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    ...ano, tohle docela pomohlo, leč stále (na debianu):
    
    $ time ./rozhod.sh 2.5Anew.out
    hotovo sefe!
    
    real    0m39.779s
    user    0m50.043s
    sys     0m1.620s
    
    
    

    Na gentoo je výsledek teměř totožný jako předtím:

    
    $ time ./rozhod.sh 2.5Anew.out
    hotovo sefe!
    
    real    0m25.424s
    user    0m23.621s
    sys     0m1.672s
    

    30.4.2007 16:07 Ash
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    Tak to asi bude tím... Použil jste to pro všechny ty operace? Tedy i pro sed, awk... je to obecně problém multibyte kódování, protože při čtení každého znaku ze souboru se volá jakási mb_funkce() což v současné době způsobuje značné zdržení. Takže to ovlivnňuje všechny nástroje, grep atd.
    1.5.2007 08:52 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    ..ouha, tak ted už ano:
    real    0m26.678s
    user    0m35.222s
    sys     0m1.716s
    

    Přestože jsou nyní výsledky srovnatelné, čekal jsem, že na debianu půjde skript mnohem rychleji, vzhledem k dvojnásobku paměti, dvojímu jádru a ješte rychlejšimu taktování. No nic, hlavní zádrhel je vyřešen, za což moc děkuji. K dalšímu zrychlení bude zřejmě potřeba se zamyslet nad strukturou toho skriptu jako takového... :)

    1.5.2007 09:20 Michal
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    Dvojjadro tomu nijak nepomuze, nemas to napsane multithreadove ;-) A vetsi pamet take ne. Kam se ztratil prirustek 20% narustu taktu? Dost mozna, ze v 64bitech. Ono gcc generuje nekdy naprosto uzasne prekvapujici kod, kde si clovek rika "takhle by me to v zivote ani nenapadlo napsat" ;-)
    1.5.2007 09:51 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo

    ano, to je pravda. Dvojjádro není žádný argument, nechal jsem se unést. Ovšem nerozumím té paměti.... je tím myšleno, že pokud se celý soubor vejde do RAM, tak už je to pak jedno? Jo, tak to bych taky bral.

    No, když na ten skript tak koukám, tak mi přijde, že nejnáročnější bude sort. Zajímalo by mě, zdali třídí rovnou to co leze z roury, nebo jestli počká, až dostane všechno a pak to roztřídí naráz? Nebo jak to vlastně dělá?

    Ze souboru potřebuji nejprve vybrat řádky obsahující slova TEMP_COLD, TEMP_HOT a CURR. Ŕádky s jednotlivými slovy chci uložit do zvláštních souborů. Nelze to udělat nějak lépe, než, že ten soubor projdu 3x za sebou? Jinými slovy, nelze místo prvních tří grepů pustit grep jenom jeden a říci mu, aby dával příslušné řádky do třech různých souborů? Počítám, že tohle přímo nepůjde, ale myšlenka je zřejmá...Nebo ještě jinak, když už prvním grepem najdu příslušné datové řádky, rád bych je alespoň zároveň vyhodil ze souboru, abych je nemusel příště procházet zase...To by šlo?

    1.5.2007 10:28 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    je tím myšleno, že pokud se celý soubor vejde do RAM, tak už je to pak jedno?

    Pokud na realizaci úlohy potřebujete určité množství paměti a toto množství máte k dispozici, pak je celkem jedno, jestli máte ještě nějakou navíc. Množství paměti se na rychlosti může projevit pouze v případě, že je buď paměti nedostatek a je nutno swapovat, nebo je při nedostatku paměti program nucen použít paměťově úspornější, ale pomalejší algoritmus.

    Fuky avatar 1.5.2007 10:36 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo

    Prvních tří grepů se můžeš zbavit např. takto:

    #!/bin/bash
    
    echo -e "AAA nic TRI\nBBB nic TRI\nCCC nic TRI" |\
    gawk '
      /AAA/ { print $1, $3 > "file.a" }
      /BBB/ { print $1, $3 > "file.b" }
      /CCC/ { print $1, $3 > "file.c" }
    '
    

    1.5.2007 11:09 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    zdá se, že to nebyl dobrý nápad:
    real    0m58.647s
    user    0m59.440s
    sys     0m1.216s
    
    
    
    #!/bin/bash
    
    FILE=`basename $1 .out`
    
    LANG=C gawk '
      /TEMP_HOT/ { print $1, $3 > "file.temp"}
      /TEMP_COLD/ { print $1, $3 > "file.cold" }
      /CURRENT/ { print $1, $3 > "file.curr" }
    ' $1
    LANG=C sed '/Time/!d; /???/d; s/:/ /g' $1 | LANG=C awk '{print $3, $5, $7, $9}' |LANG=C sort -n |LANG=C uniq > $FILE.fin
    echo "hotovo sefe!"
    
    exit 0
    
    
    Fuky avatar 1.5.2007 15:05 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo

    Zkoušel jsem:

    #!/bin/bash
    
    if [ "$2" == "gawk" ]; then
      gawk '
        /AAA/ { print $1, $3 > "gawk.a"; next }
        /BBB/ { print $1, $3 > "gawk.b"; next }
        /CCC/ { print $1, $3 > "gawk.c"; next }
      ' $1
    elif [ "$2" == "grep" ]; then
      grep "AAA" $1 |gawk '{ print $1, $3 }' > grep.a
      grep "BBB" $1 |gawk '{ print $1, $3 }' > grep.b
      grep "CCC" $1 |gawk '{ print $1, $3 }' > grep.c
    elif [ "$2" == "sed" ]; then
      grep "AAA" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.a
      grep "BBB" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.b
      grep "CCC" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.c
    elif [ "$2" == "bash" ]; then
      grep "AAA" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.a
      grep "BBB" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.b
      grep "CCC" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.c
    elif [ "$2" == "c" ]; then
      grep "AAA" $1 |./column > c.a
      grep "BBB" $1 |./column > c.b
      grep "CCC" $1 |./column > c.c
    fi
    

    Nejvíce zdržuje vypsání prvního a třetího sloupce. Rychlejší způsob než C jsem nenašel.

    column.c:

    #include <stdio.h>
    #include <stdlib.h>
    #include <string.h>
    
    #define BUFFER_MAX 1024
    
    int main(void)
    {
      int i;
      char buffer[BUFFER_MAX];
      char *p_buffer;
      char *column;
    
      while (fgets(buffer, BUFFER_MAX, stdin) != NULL) {
        p_buffer = buffer;
    
        for (i = 0; i < 3; ++i) {
          if (p_buffer == NULL) {
            continue;
          }
    
          while (*p_buffer == ' ') {
            ++p_buffer;
          }
    
          if ((column = strsep(&p_buffer, " ")) == NULL) {
            continue;
          }
    
          switch (i) {
            case 0: printf("%s", column);  break;
            case 2: printf(" %s", column); break;
            default:                       break;
          }
        }
      }
    
      return 0;
    }
    

    Fuky avatar 1.5.2007 11:04 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo

    Jestli Tě zajímá jak pracuje sort, máš k dispozici jeho zdrojáky ;-) Všimni si, že si vytváří v /tmp pomocné soubory (ls -lh /tmp/sort*), takže když ho použiješ na velký soubor může pomalé RW disku znatelně zpomalit jeho běh, což může být další zásadní rozdíl mezi sestavami, na kterých jsi prováděl testy.

    1.5.2007 11:15 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    :) zdrojáky si nechávám jako opravdu až tu nejzazší možnost, hlavně proto, že nejsem v C vůbec zběhlý a tak se obávám, že by mi to zabralo příliš mnoho casu

    Ovšem s těmi disky to bude skvělá trefa. Sestava s gentoo má zřejmě disky o něco rychlejší.
    1.5.2007 09:50 Michal
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    <sarkasmus>Predne bych ti chtel napsat co to jsou komprimacni programy. Kdyz nimi prozenes textovy soubor (obzvlaste s takovym mnozstim opakujicich se casti jako tento) tak dokazou zmensit jejich objem na 1/25 a lidi pak stahujou mnohem mensi mnozstvi dat. U sebe to pak dekomrimuji a ziskaji puvodni soubor. Opravdu. Nekecam! viz napr. man bzip2<sarkasmus>

    Pro srovnani vysledky z gentoo 64bit, Core 2 Duo E6600 @ 3.5GHz
    real    0m10.949s
    user    0m13.385s
    sys     0m1.212s
    
    real<(user+sys) takze asi preci jen to je napsano mutithreadove.
    1.5.2007 10:05 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    už jsem to opravil... sbalene to ma nejakych 8MiB. Člověk holt nemyslí na všechno :)

    sbalena data
    1.5.2007 10:06 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    už jsem to opravil... sbalene to ma nejakych 8MiB. Člověk holt nemyslí na všechno :)

    sbalena data
    1.5.2007 10:08 hajoucha | skóre: 22
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    hrome... překlep! Platí až ten druhý link.
    1.5.2007 10:32 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: rychlost skriptu na debian amd64 vs. gentoo
    Na to, abyste využil více procesorů (jader), nepotřebujete multithreadovou aplikaci. Když propojíte dva příkazy (náročné na procesor) rourou a nic jiného v systému procesor(y) zatěžovat nebude, poběží každý na jednom procesoru a na dvouprocesorovém systému to bude rychlejší i bez multithreadových aplikací. Schválně se můžete podívat do zdrojáků použitých utilit, zda někde volají pthread_create().

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.