abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 08:50 | Nová verze
    Vyšel Redmine 7.0, jeden z nejlepších open source ticketovacích systémů. Došlo k migraci na Rails 8, vylepšení UI/UX, Workflow, byla přidána podpora náhledu pro Microsoft Office a LibreOffice dokumenty, došlo k výkonnostním optimalizacím a přibylo spoustu dalších oprav a novinek. Více informací v oficiálním oznámení.
    Max | Komentářů: 0
    včera 16:22 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 166 (pdf).

    Ladislav Hagara | Komentářů: 1
    včera 03:33 | Pozvánky

    Blíží se prázdniny a než se rozutečete k moři, je na čase se opět sejít na Virtuální Bastlírně - pravidelném setkání elektroniků, ajťáků, bastlířů a obecně nadšenců do techniky. Co si pro vás strahovští bastlíři připravili tentokrát? Určitě proberou blížící se Linux Days i další události. U softwaru se chvíli zdrží a poví si kupříkladu o tom, jak se zbavit Bambu Cloudu, ale nepřijít o možnost ovládat tiskárnu na dálku. Řeč dojde i na AI,

    … více »
    bkralik | Komentářů: 1
    včera 03:22 | Nová verze

    Vývojáři postmarketOS vydali verzi 26.06 tohoto operačního systému pro chytré telefony vycházejícího z optimalizovaného a nakonfigurovaného Alpine Linuxu s vlastními balíčky. Přehled novinek v příspěvku na blogu. Na výběr jsou 4 uživatelská rozhraní: GNOME, KDE Plasma Mobile, Phosh a Sxmo.

    Ladislav Hagara | Komentářů: 1
    včera 03:11 | Nová verze

    Byla vydána nová verze 2.55.0 distribuovaného systému správy verzí Git. Přispělo 100 vývojářů, z toho 33 nových. Přehled novinek v příspěvku na blogu GitHubu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 1
    29.6. 20:22 | IT novinky

    Craig Loewen na blogu Microsoftu oznámil veřejnou preview verzi WSL kontejnerů, tj. linuxových kontejnerů ve Windows Subsystem for Linux (WSL). Spouští se příkazem wslc.exe.

    Ladislav Hagara | Komentářů: 1
    29.6. 19:00 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 2026.2 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem 9 nových nástrojů v oficiálním oznámení na blogu.

    Ladislav Hagara | Komentářů: 0
    29.6. 12:55 | Nová verze

    Grafická aplikace Krokiet/Czkawka pro vyhledávání a odstraňovaní nepotřebných souborů (duplicitní soubory, prázdné složky, podobné obrázky, podobná videa, poškozené soubory a další) byla vydána ve verzi 12.0.0. Podrobný přehled novinek v příspěvku na Medium. Jedná se o poslední verzi frontendu Czkawka GTK nad Czkawka Core. Uživatelům se doporučuje migrovat na frontend Krokiet postavený nad frameworkem Slint. Představena byla aplikace Cedinia pro Android využívající Czkawka Core. Dostupná je jako APK pro ruční instalaci.

    Ladislav Hagara | Komentářů: 6
    29.6. 04:22 | Nová verze

    Po téměř třech letech od vydání verze 9 byla vydána nová verze 10 linuxové distribuce Mageia (Wikipedie). Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 2
    28.6. 04:00 | Zajímavý software

    Nourish (GitHub) je nový správce oken pro Linux. Tradiční plochy nahrazuje nekonečným plátnem a posouváním a přibližováním. Využívá vlastní kompozitor pro Wayland s názvem y5. Videoukázka.

    Ladislav Hagara | Komentářů: 6
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (17%)
     (31%)
     (4%)
     (6%)
     (2%)
     (16%)
     (26%)
    Celkem 2022 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    6.5.2009 00:22 | Přečteno: 1329× | iné

    #!/bin/bash
    SRT="$1"
    TMP1=`mktemp`
    if [ -z "$SRT" ]; then
      echo "USAGE: `basename $0` [file_in_cp1250_dos_eol.srt]"
      exit
    fi 
    cstocs 1250 utf8 "$SRT" | dos2unix | \
      grep -v '\-\->' | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g' | \
      grep -v '^$' | perl -Mutf8 -pe 'utf8::decode($_);$_=lc($_);utf8::encode($_);' > "$TMP1"
    k=0
    m=`sort -u "$TMP1" | wc -l`
    for i in `sort -u "$TMP1"`; do
      k=$(($k+1))
      POCET=`grep '^'$i'$' "$TMP1" | wc -l`
      echo "$k/$m ... $POCET $i" > /dev/stderr
      echo $POCET $i
    done | sort -nr > "$SRT.stat"
    rm "$TMP1"
    

    Poznámky

    $ time srtstat 'The Code - Linux.srt' 2>/dev/null
    real	0m15.628s
    user	0m12.093s
    sys	0m11.821s
    (Intel Atom 1.6 GHz, 1 GB ram, SATA disk 250 GB hitachi 8MB cache)
    
    $ head -20 'The Code - Linux.srt.stat'
    106 a
    104 to
    85 je
    67 na
    63 v
    61 se
    42 že
    34 jsem
    33 z
    31 linux
    29 ale
    27 co
    24 s
    24 pro
    24 linuxu
    23 o
    23 jako
    22 byl
    21 si
    21 jsou
    
           

    Hodnocení: 70 %

            špatnédobré        

    Anketa

    Chcete pokračovanie tohoto mini seriálu?
     (88 %)
     (13 %)
    Celkem 40 hlasů

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    jose17 avatar 6.5.2009 07:39 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    > zavyslosti

    nechcel si uz rovno napisat zavyslosty? :-)

    Ja vim, on vi, ty nano!
    6.5.2009 08:27 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Tohle je fakt blbinka. Proč se to jmenuje blbinky v bashi, když tam voláš: sed, grep, cstocs, dos2unix jako zlatý hřeb na závěr - perl?
    default avatar 6.5.2009 09:30 default | skóre: 22 | Madrid
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    Protože to jde mnohem jednoduššeji napsat přimo v tom Perlu či AWK? Ale když si tak uvědomuji ty závislosti, jejich verze a jejich nepodporu UTF-8, tak si myslím, že nejjednodušší by to bylo v Javě. Žádný dos2unix, tr, iconv, whatever… Žádný řešení závislostí… :-D

    6.5.2009 21:09 kralyk z abclinuxu | skóre: 29 | blog:
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Žádný řešení závislostí… :-D
    JRE ;-)
    hikikomori82 avatar 6.5.2009 10:55 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Ano, toto sa pytal niekto uz minule, mas nejaky lepsi nazov? Tieto skripty su z kategorie "napisat, pouzit, zahodit", pouzivaju vsetky dostupne commandline utility, bash je len pojitko. Nebudem predsa pouzivat nejaky iny jazyk alebo tento skript prepisovat len preto ze sa neda napisat 100% vystizny nazov blogu.
    6.5.2009 13:40 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    No kdybys ten blog nazval "Vtákoviny v shelle", bylo by to výstižnější ;-)
    hikikomori82 avatar 6.5.2009 15:53 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Rozmyslal som ze by som to skratil na "Blbinky (2) - Najčastejšie slová v srt titulkoch"
    6.5.2009 11:14 CEST
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hmmm, fakt jsi to s tim perlem prehnal. Pokud se to jmenuje "...v bashi", tak se zkus spis zamerit na bash. Jak do bashe nacpes perl, pripadne jeste jednu velkou rouru s pouzitim dalsich utilitek jako grep, sed a awk, tak uz je mozna lepsi napsat rovnou perl skript.

    BTW: U me umi i tr prevadet ISO-8859-2 mala na velka a obracene.

    Ja bych to v bashi resil spis takhle:
    time iconv -f cp1250 -t l2 a.srt \
    | sed -n -e '/^[0-9]\+[[:space:]]*$/d;/-->/d;s/<\/\?[^>]\+>//g;s/[^[:alpha:]]/ /g;s/[[:space:]]\+/\n/g;p;' \
    | tr '[:upper:]' '[:lower:]' \
    | grep -Ev '^[[:space:]]*$'  \
    | sort | uniq -c | sort -nr
    
    BTW: Titulky jsou z dilu HIMYM 4.21 a casy jsou
    real    0m0.152s
    user    0m0.024s
    sys     0m0.008s
    
    6.5.2009 21:00 ^([0-9a-fA-F]{2}([:-]?|$)){6}$
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hahaha, pobavil jsi me :-) To je prispevek dnesniho dne! Btw poznas, co sezere regularni vyraz v mem v nicku?

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.