abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:44 | Nová verze

    Vývojáři z Laboratoří CZ.NIC vydali nové verze aplikací Datovka (Datovka 4.29.0, Mobilní Datovka 2.6.2). V případě desktopové verze přibyly možnosti projít všechny uložené zprávy, zkontrolovat časy expirací časových razítek a přerazítkovat datové zprávy, které lze v ISDS přerazítkovat. Novinkou je také možnost vytahovat myší ze seznamu ZFO soubory datových zpráv, tento úkon jde udělat i pomocí tlačítek Ctrl+C. Nová verze Mobilní Datovky přináší jen drobné úpravy.

    VSladek | Komentářů: 0
    včera 21:55 | Nová verze

    MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.28.0. Z novinek lze vypíchnout novou třídu machine.CAN.

    Ladislav Hagara | Komentářů: 0
    včera 10:22 | Komunita

    Michael Meeks, CEO společnosti Collabora, na apríla oznámil, nebyl to ale apríl, že nadace The Document Foundation zastřešující vývoj kancelářského balíku LibreOffice vyloučila ze svých řad všechny zaměstnance a partnery společnosti Collabora, tj. více než třicet lidí, kteří po mnoho let přispívali do LibreOffice. Nadace The Document Foundation po několika dnech publikovala oficiální vyjádření. Přiznává pochybení při zakládání

    … více »
    Ladislav Hagara | Komentářů: 9
    6.4. 05:33 | Pozvánky

    Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že v úterý 14. dubna (změna!!!) od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout

    … více »
    bkralik | Komentářů: 3
    5.4. 23:33 | Nová verze

    Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.

    Ladislav Hagara | Komentářů: 1
    5.4. 23:00 | Zajímavý projekt

    VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.

    NUKE GAZA! 🎆 | Komentářů: 8
    5.4. 05:22 | Zajímavý software

    Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.

    Ladislav Hagara | Komentářů: 20
    5.4. 04:11 | Zajímavý software

    Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.

    Ladislav Hagara | Komentářů: 2
    4.4. 04:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).

    Ladislav Hagara | Komentářů: 21
    3.4. 16:44 | Nová verze

    ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (7%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (1%)
     (14%)
     (23%)
    Celkem 1237 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    6.5.2009 00:22 | Přečteno: 1315× | iné

    #!/bin/bash
    SRT="$1"
    TMP1=`mktemp`
    if [ -z "$SRT" ]; then
      echo "USAGE: `basename $0` [file_in_cp1250_dos_eol.srt]"
      exit
    fi 
    cstocs 1250 utf8 "$SRT" | dos2unix | \
      grep -v '\-\->' | sed 's/<i>//g;s/<\/i>//g;s/[ ,.\*\(\)\"0123456789-\/]/\n/g' | \
      grep -v '^$' | perl -Mutf8 -pe 'utf8::decode($_);$_=lc($_);utf8::encode($_);' > "$TMP1"
    k=0
    m=`sort -u "$TMP1" | wc -l`
    for i in `sort -u "$TMP1"`; do
      k=$(($k+1))
      POCET=`grep '^'$i'$' "$TMP1" | wc -l`
      echo "$k/$m ... $POCET $i" > /dev/stderr
      echo $POCET $i
    done | sort -nr > "$SRT.stat"
    rm "$TMP1"
    

    Poznámky

    $ time srtstat 'The Code - Linux.srt' 2>/dev/null
    real	0m15.628s
    user	0m12.093s
    sys	0m11.821s
    (Intel Atom 1.6 GHz, 1 GB ram, SATA disk 250 GB hitachi 8MB cache)
    
    $ head -20 'The Code - Linux.srt.stat'
    106 a
    104 to
    85 je
    67 na
    63 v
    61 se
    42 že
    34 jsem
    33 z
    31 linux
    29 ale
    27 co
    24 s
    24 pro
    24 linuxu
    23 o
    23 jako
    22 byl
    21 si
    21 jsou
    
           

    Hodnocení: 70 %

            špatnédobré        

    Anketa

    Chcete pokračovanie tohoto mini seriálu?
     (88 %)
     (13 %)
    Celkem 40 hlasů

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    jose17 avatar 6.5.2009 07:39 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    > zavyslosti

    nechcel si uz rovno napisat zavyslosty? :-)

    Ja vim, on vi, ty nano!
    6.5.2009 08:27 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Tohle je fakt blbinka. Proč se to jmenuje blbinky v bashi, když tam voláš: sed, grep, cstocs, dos2unix jako zlatý hřeb na závěr - perl?
    default avatar 6.5.2009 09:30 default | skóre: 22 | Madrid
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch

    Protože to jde mnohem jednoduššeji napsat přimo v tom Perlu či AWK? Ale když si tak uvědomuji ty závislosti, jejich verze a jejich nepodporu UTF-8, tak si myslím, že nejjednodušší by to bylo v Javě. Žádný dos2unix, tr, iconv, whatever… Žádný řešení závislostí… :-D

    6.5.2009 21:09 kralyk z abclinuxu | skóre: 29 | blog:
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Žádný řešení závislostí… :-D
    JRE ;-)
    hikikomori82 avatar 6.5.2009 10:55 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Ano, toto sa pytal niekto uz minule, mas nejaky lepsi nazov? Tieto skripty su z kategorie "napisat, pouzit, zahodit", pouzivaju vsetky dostupne commandline utility, bash je len pojitko. Nebudem predsa pouzivat nejaky iny jazyk alebo tento skript prepisovat len preto ze sa neda napisat 100% vystizny nazov blogu.
    6.5.2009 13:40 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    No kdybys ten blog nazval "Vtákoviny v shelle", bylo by to výstižnější ;-)
    hikikomori82 avatar 6.5.2009 15:53 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Rozmyslal som ze by som to skratil na "Blbinky (2) - Najčastejšie slová v srt titulkoch"
    6.5.2009 11:14 CEST
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hmmm, fakt jsi to s tim perlem prehnal. Pokud se to jmenuje "...v bashi", tak se zkus spis zamerit na bash. Jak do bashe nacpes perl, pripadne jeste jednu velkou rouru s pouzitim dalsich utilitek jako grep, sed a awk, tak uz je mozna lepsi napsat rovnou perl skript.

    BTW: U me umi i tr prevadet ISO-8859-2 mala na velka a obracene.

    Ja bych to v bashi resil spis takhle:
    time iconv -f cp1250 -t l2 a.srt \
    | sed -n -e '/^[0-9]\+[[:space:]]*$/d;/-->/d;s/<\/\?[^>]\+>//g;s/[^[:alpha:]]/ /g;s/[[:space:]]\+/\n/g;p;' \
    | tr '[:upper:]' '[:lower:]' \
    | grep -Ev '^[[:space:]]*$'  \
    | sort | uniq -c | sort -nr
    
    BTW: Titulky jsou z dilu HIMYM 4.21 a casy jsou
    real    0m0.152s
    user    0m0.024s
    sys     0m0.008s
    
    6.5.2009 21:00 ^([0-9a-fA-F]{2}([:-]?|$)){6}$
    Rozbalit Rozbalit vše Re: Blbinky v bashi (2) - Najčastejšie slová v srt titulkoch
    Hahaha, pobavil jsi me :-) To je prispevek dnesniho dne! Btw poznas, co sezere regularni vyraz v mem v nicku?

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.