abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:44 | IT novinky

    Vláda Spojených států získala desetiprocentní podíl v americkém výrobci čipů Intel. Oznámili to podle agentur americký prezident Donald Trump a ministr obchodu Howard Lutnick. Společnost Intel uvedla, že výměnou za desetiprocentní podíl obdrží státní dotace v hodnotě 8,9 miliardy dolarů (zhruba 186 miliard Kč). Částka podle Intelu zahrnuje dříve přislíbené subvence 5,7 miliardy dolarů z programu CHIPS na podporu výroby čipů v USA,

    … více »
    Ladislav Hagara | Komentářů: 2
    včera 17:33 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 27 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 04:22 | Nová verze

    Knihovna FFmpeg byla vydána ve verzi 8.0 „Huffman“. Přibyla mj. podpora hardwarově akcelerovaného kódování s využitím API Vulcan, viz seznam změn.

    Fluttershy, yay! | Komentářů: 0
    22.8. 17:44 | IT novinky

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) vydal Zprávu o stavu kybernetické bezpečnosti ČR za rok 2024 (pdf). V loňském roce NÚKIB evidoval dosud nejvíce kybernetických bezpečnostních incidentů s celkovým počtem 268. Oproti roku 2023 se však jedná pouze o drobný nárůst a závažnost dopadů evidovaných incidentů klesá již třetím rokem v řadě. V minulém roce NÚKIB evidoval pouze jeden velmi významný incident a významných incidentů bylo zaznamenáno 18, což oproti roku 2023 představuje pokles o více než polovinu.

    Ladislav Hagara | Komentářů: 1
    22.8. 13:55 | Komunita

    Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie). Servo mimo jiné nově zvládne animované obrázky APNG a WebP.

    Ladislav Hagara | Komentářů: 0
    22.8. 13:11 | IT novinky

    Na chytré telefony a počítačové tablety v Rusku bude od začátku příštího měsíce povinné předinstalovávat státem podporovanou komunikační aplikaci MAX, která konkuruje aplikaci WhatsApp americké společnosti Meta Platforms. Oznámila to dnes ruská vláda. Ta by podle kritiků mohla aplikaci MAX používat ke sledování uživatelů. Ruská státní média obvinění ze špehování pomocí aplikace MAX popírají. Tvrdí, že MAX má méně oprávnění k přístupu k údajům o uživatelích než konkurenční aplikace WhatsApp a Telegram.

    Ladislav Hagara | Komentářů: 36
    22.8. 04:22 | IT novinky

    Společnost PINE64 stojící za telefony PinePhone nebo notebooky Pinebook publikovala na svém blogu srpnový souhrn novinek. Kvůli nedostatečnému zájmu byla ukončena výroba telefonů PinePhone Pro.

    Ladislav Hagara | Komentářů: 2
    21.8. 22:22 | Nová verze

    Po pěti měsících vývoje byla vydána nová verze 0.15.1 programovacího jazyka Zig (GitHub, Wikipedie). Verze 0.15.0 byla přeskočena. Přispělo 162 vývojářů. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    21.8. 21:55 | Komunita

    Před sedmi lety společnost Valve představila fork projektu Wine s názvem Proton umožňující v Linuxu přímo ze Steamu hrát počítačové hry do té doby běžící pouze ve Windows. Aktuální přehled podporovaných her na stránkách ProtonDB

    Ladislav Hagara | Komentářů: 0
    21.8. 14:55 | IT novinky

    Společnost DuckDuckGo rozšířila svůj AI chat Duck.ai o GPT-5 mini (𝕏). Duck.ai umožňuje anonymní přístup bez vytváření účtů k několika modelům umělé inteligence. Aktuálně k GPT-4o mini, GPT-5 mini, Llama 4 Scout, Claude Haiku 3.5 a Mistral Small 3.

    Ladislav Hagara | Komentářů: 6
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (77%)
     (8%)
     (3%)
     (5%)
     (6%)
     (0%)
    Celkem 62 hlasů
     Komentářů: 6, poslední 21.8. 13:35
    Rozcestník

    Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    6.5.2009 00:22 | Přečteno: 1264× | iné

    #!/bin/bash
    SRT="$1"
    TMP1=`mktemp`
    if [ -z "$SRT" ]; then
      echo "USAGE: `basename $0` [file_in_cp1250_dos_eol.srt]"
      exit
    fi 
    cstocs 1250 utf8 "$SRT" | dos2unix | \
      grep -v '\-\->' | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g' | \
      grep -v '^$' | perl -Mutf8 -pe 'utf8::decode($_);$_=lc($_);utf8::encode($_);' > "$TMP1"
    k=0
    m=`sort -u "$TMP1" | wc -l`
    for i in `sort -u "$TMP1"`; do
      k=$(($k+1))
      POCET=`grep '^'$i'$' "$TMP1" | wc -l`
      echo "$k/$m ... $POCET $i" > /dev/stderr
      echo $POCET $i
    done | sort -nr > "$SRT.stat"
    rm "$TMP1"
    

    Poznámky

    $ time srtstat 'The Code - Linux.srt' 2>/dev/null
    real	0m15.628s
    user	0m12.093s
    sys	0m11.821s
    (Intel Atom 1.6 GHz, 1 GB ram, SATA disk 250 GB hitachi 8MB cache)
    
    $ head -20 'The Code - Linux.srt.stat'
    106 a
    104 to
    85 je
    67 na
    63 v
    61 se
    42 že
    34 jsem
    33 z
    31 linux
    29 ale
    27 co
    24 s
    24 pro
    24 linuxu
    23 o
    23 jako
    22 byl
    21 si
    21 jsou
    
           

    Hodnocení: 70 %

            špatnédobré        

    Anketa

    Chcete pokračovanie tohoto mini seriálu?
     (88 %)
     (13 %)
    Celkem 40 hlasů

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    jose17 avatar 6.5.2009 07:39 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    > zavyslosti

    nechcel si uz rovno napisat zavyslosty? :-)

    Ja vim, on vi, ty nano!
    6.5.2009 08:27 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Tohle je fakt blbinka. Proč se to jmenuje blbinky v bashi, když tam voláš: sed, grep, cstocs, dos2unix jako zlatý hřeb na závěr - perl?
    default avatar 6.5.2009 09:30 default | skóre: 22 | Madrid
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    Protože to jde mnohem jednoduššeji napsat přimo v tom Perlu či AWK? Ale když si tak uvědomuji ty závislosti, jejich verze a jejich nepodporu UTF-8, tak si myslím, že nejjednodušší by to bylo v Javě. Žádný dos2unix, tr, iconv, whatever… Žádný řešení závislostí… :-D

    6.5.2009 21:09 kralyk z abclinuxu | skóre: 29 | blog:
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Žádný řešení závislostí… :-D
    JRE ;-)
    hikikomori82 avatar 6.5.2009 10:55 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Ano, toto sa pytal niekto uz minule, mas nejaky lepsi nazov? Tieto skripty su z kategorie "napisat, pouzit, zahodit", pouzivaju vsetky dostupne commandline utility, bash je len pojitko. Nebudem predsa pouzivat nejaky iny jazyk alebo tento skript prepisovat len preto ze sa neda napisat 100% vystizny nazov blogu.
    6.5.2009 13:40 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    No kdybys ten blog nazval "Vtákoviny v shelle", bylo by to výstižnější ;-)
    hikikomori82 avatar 6.5.2009 15:53 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Rozmyslal som ze by som to skratil na "Blbinky (2) - Najčastejšie slová v srt titulkoch"
    6.5.2009 11:14 CEST
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hmmm, fakt jsi to s tim perlem prehnal. Pokud se to jmenuje "...v bashi", tak se zkus spis zamerit na bash. Jak do bashe nacpes perl, pripadne jeste jednu velkou rouru s pouzitim dalsich utilitek jako grep, sed a awk, tak uz je mozna lepsi napsat rovnou perl skript.

    BTW: U me umi i tr prevadet ISO-8859-2 mala na velka a obracene.

    Ja bych to v bashi resil spis takhle:
    time iconv -f cp1250 -t l2 a.srt \
    | sed -n -e '/^[0-9]\+[[:space:]]*$/d;/-->/d;s/<\/\?[^>]\+>//g;s/[^[:alpha:]]/ /g;s/[[:space:]]\+/\n/g;p;' \
    | tr '[:upper:]' '[:lower:]' \
    | grep -Ev '^[[:space:]]*$'  \
    | sort | uniq -c | sort -nr
    
    BTW: Titulky jsou z dilu HIMYM 4.21 a casy jsou
    real    0m0.152s
    user    0m0.024s
    sys     0m0.008s
    
    6.5.2009 21:00 ^([0-9a-fA-F]{2}([:-]?|$)){6}$
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hahaha, pobavil jsi me :-) To je prispevek dnesniho dne! Btw poznas, co sezere regularni vyraz v mem v nicku?

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.