abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:11 | Nová verze

    Bylo vydáno openSUSE Leap 16 (cs). Ve výchozím nastavení přichází s vypnutou 32bitovou (ia32) podporou. Uživatelům však poskytuje možnost ji ručně povolit a užívat si tak hraní her ve Steamu, který stále závisí na 32bitových knihovnách. Změnily se požadavky na hardware. Leap 16 nyní vyžaduje jako minimální úroveň architektury procesoru x86-64-v2, což obecně znamená procesory zakoupené v roce 2008 nebo později. Uživatelé se starším hardwarem mohou migrovat na Slowroll nebo Tumbleweed.

    Ladislav Hagara | Komentářů: 0
    dnes 16:00 | IT novinky

    Ministerstvo průmyslu a obchodu (MPO) ve spolupráci s Národní rozvojovou investiční (NRI) připravuje nový investiční nástroj zaměřený na podporu špičkových technologií – DeepTech fond. Jeho cílem je posílit inovační ekosystém české ekonomiky, rozvíjet projekty s vysokou přidanou hodnotou, podpořit vznik nových technologických lídrů a postupně zařadit Českou republiku mezi země s nejvyspělejší technologickou základnou.

    … více »
    Ladislav Hagara | Komentářů: 2
    dnes 12:55 | Nová verze

    Radicle byl vydán ve verzi 1.5.0 s kódovým jménem Hibiscus. Jedná se o distribuovanou alternativu k softwarům pro spolupráci jako např. GitLab.

    Ladislav Hagara | Komentářů: 3
    dnes 03:22 | IT novinky

    Společnost OpenAI představila text-to-video AI model Sora 2 pro generování realistických videí z textového popisu. Přesnější, realističtější a lépe ovladatelný než předchozí modely. Nabízí také synchronizované dialogy a zvukové efekty.

    Ladislav Hagara | Komentářů: 4
    včera 23:11 | Nová verze

    UBports, nadace a komunita kolem Ubuntu pro telefony a tablety Ubuntu Touch, vydala Ubuntu Touch 24.04-1.0, tj. první stabilní vydání založené na Ubuntu 24.04 LTS.

    Ladislav Hagara | Komentářů: 0
    včera 21:00 | Komunita

    Rakouská armáda přechází na LibreOffice. Ne kvůli licencím (16 000 počítačů). Hlavním důvodem je digitální suverenita. Prezentace v pdf z LibreOffice Conference 2025.

    Ladislav Hagara | Komentářů: 23
    včera 12:44 | Bezpečnostní upozornění

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) upozorňuje na sérii kritických zranitelností v Cisco Adaptive Security Appliance (ASA) a Firepower Threat Defense (FTD) a Cisco IOS, CVE-2025-20333, CVE-2025-20363 a CVE-2025-20362. Zneužití těchto zranitelností může umožnit vzdálenému neautentizovanému útočníkovi spustit libovolný kód (RCE). Společnost Cisco uvedla, že si je vědoma aktivního zneužívání těchto zranitelností.

    Ladislav Hagara | Komentářů: 16
    včera 12:11 | IT novinky

    Ochrana uživatelů a zároveň příznivé podmínky pro rozvoj umělé inteligence (AI). Ministerstvo průmyslu a obchodu (MPO) připravilo minimalistický návrh implementace evropského nařízení o umělé inteligenci, tzv. AI aktu. Český zákon zajišťuje ochranu občanům a bezpečné používání AI, ale zároveň vytváří pro-inovační prostředí, ve kterém se může AI naplno rozvíjet, firmy mohou využít jeho potenciál a nebudou zatíženy zbytečnou administrativou. Návrh je nyní v meziresortním připomínkovém řízení.

    Ladislav Hagara | Komentářů: 8
    včera 05:11 | Komunita

    Dle plánu Linus Torvalds odstranil souborový systém bcachefs z mainline Linuxu. Tvůrce bcachefs Kent Overstreet na Patreonu informuje, že bcachefs je nově distribuován jako DKMS modul.

    Ladislav Hagara | Komentářů: 2
    29.9. 17:44 | IT novinky

    PIF, Silver Lake a Affinity Partners kupují videoherní společnost Electronic Arts (EA) za 55 miliard dolarů (1,14 bilionu korun).

    Ladislav Hagara | Komentářů: 2
    Jaké řešení používáte k vývoji / práci?
     (39%)
     (48%)
     (13%)
     (15%)
     (18%)
     (14%)
     (18%)
     (14%)
     (14%)
    Celkem 147 hlasů
     Komentářů: 9, poslední 24.9. 17:28
    Rozcestník

    Dotaz: extrakce textu podle masky

    8.3.2005 19:04 Pepais | skóre: 1
    extrakce textu podle masky
    Přečteno: 303×
    Cau, potreboval bych pomoci programu SED nebo AWK extrahovat z textoveho proudu slova zadana pomoci urcite masky. napr.

    zadal bych masku ¨??x9??c¨

    pak bych aby me to na obrazovku vytisklo vsechna slova, ktera maji na treti pozici "x" na ctvrte "9" a na posledni pozici "c". jak na to?? dikec...

    Odpovědi

    8.3.2005 19:18 Michal Marek (twofish) | skóre: 55 | blog: { display: blog; } | Praha
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    man cokoliv co pracuje s regulárními výrazy
    
    Místo otazníku použít tečku. A jestli to mají být skutečně slova, tak ten výraz dát do \<...\>
    8.3.2005 21:35 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    sed 's/\<\|\>/\n/g' | sed -n '/^..x9..c$/p'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    31.7.2006 12:53 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    sed -n '/^..x9..c$/p' text.txt

    Tohle by se me libilo, ale kdyz je tech slov na radku vic, tak mi to nefunguje a nevypise to nic.

    treba kdyz je v text.txt

    12x45c # funguje 12x45c abcd # nefunguje

    Neexistuje neco jednoducheho co by zvladlo vic slov na radku ? (pokousim se o reg. vyrazy a hledam v diskuzich - proto ten starsi prispevek)

    Dekuji Kamil
    31.7.2006 12:55 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    sed -n '/^..x9..c$/p' text.txt

    Tohle by se me libilo, ale kdyz je tech slov na radku vic, tak mi to nefunguje a nevypise to nic.

    treba kdyz je v text.txt

    12x45c # funguje 12x45c abcd # nefunguje

    Neexistuje neco jednoducheho co by zvladlo vic slov na radku ? (pokousim se o reg. vyrazy a hledam v diskuzich - proto ten starsi prispevek)

    Dekuji Kamil
    31.7.2006 13:11 klobouk | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    musis to napsat cele tak jak ti poradil ;-) i s tim prvnim sedem a trubkou ;-)
    Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)
    31.7.2006 13:43 five | skóre: 6 | Bratislava
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    ak ma za tym nieco nasledovat, tak odstran poslednu kotvu $ (ta co znamena koniec riadku) tj /^.x9..c/,

    ak tam chces mat znak koniec slova, skus najst ( v perlovskych regularnych vyrazoch je to \b ) v simple regexp tusim \> ... neiste, skus: sed -n '/^..x9..c\>/p' text.txt
    31.7.2006 13:28 ams | skóre: 10
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Pokud pouziti SED nebo AWK neni podminkou, slo by pouzit
    grep -o '\<..x9..c\>'
    
    31.7.2006 13:39 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    grep -o '\<..x9..c\>'

    Tohle funguje, ale vypise to celou radku za tim slovem. Bohuzel prepinac -o me to nevzalo .. (grep: neznámý přepínač -- o)
    David Watzke avatar 1.8.2006 03:56 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Tohle funguje, ale vypise to celou radku za tim slovem.
    Přesně tomu zamezí přepínač -o. Co to máš za verzi grepu?
    $ grep --version
    grep (GNU grep) 2.5.1
    
    Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
    This is free software; see the source for copying conditions. There is NO
    warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    1.8.2006 09:13 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Na stroji kde jsem to testoval je nejaka starsi verze RedHatu grep (GNU grep) 2.4

    Na jinem stroji s novym Debianem me to funguje grep (GNU grep) 2.5.1
    31.7.2006 13:54 klobouk | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    ono to vsechno zavisi na "typu" sedu a grep, ale tohle by mozna mohlo fungovat (teda mne to jede). To, ze to pokracuje na dalsim radku je DULEZITE ;-)
    cat test.txt | sed 's/\ /\
    /g' | sed -n '/^..x9..c$/p'
    Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)
    31.7.2006 14:14 klobouk | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    a kdyby to neslo, tak tahle variace stejneho postupu i s vyuzitim awk uz musi jit snad na tutti :-)

    awk '{ gsub(/\ /, "\n"); print }' | sed -n '/^..x9..c$/p'
    Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)
    31.7.2006 14:20 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    awk '{ gsub(/\ /, "\n"); print }' | sed -n '/^..x9..c$/p'

    Super, tohle bude ono. Diky vsem
    31.7.2006 15:02 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Mně se to teda zas tak nelíbí. Vždyť funkčně je to ekvivalentní s tím, co psal Hynek Vychodil, pouze tohle používá dva programy místo jednoho.
    31.7.2006 15:25 klobouk | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Ano, je to stejne a vysel jsem z toho, co napsal. Jedina vyhoda me upravy toho postupu je, ze to funguje. To co poradil Hynek Vychodil tazateli nefungovalo, ackoliv je to mnohem elegantnejsi reseni (a mne se libi vic). Proto jsem prvni sed nahradil awk, protoze obycejny sed s \n normalne pracovat neumi (pokud vim tak to umi asi GNU sed).

    Bmw. docela rad bych vedel jak to udelat jednodusseji, takze se tesim na dalsi lepsi reseni jinych lidi, protoze jsem problem s \n v "obyc" sedu resil uz mockrat a nevyresil. Srry, I did my best ;-) :-)
    Buh stvoril Evu a rekl Adamovi: "Tady mas a vyber si!" ;-)
    31.7.2006 18:03 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    No zda se, ze jsem to zase nevyresil

    Jde me vlastne od zacatku nahradu meho skriptu co jsem si udelal ve Win za pomoci wget + autoit + blat a ted bych to chtel predelat na linux.

    Tam jsem to mel udelane jednoduse ze script nasel retezec treba v index.html posunul se o x znaku doprava pak nacetl xy znaku do schranky a ulozil do souboru.

    To by bylo asi idealni i tady a nevim jesli to jde za pomoci reg. vyrazu udelat. Mozna na to jdu moc od lesa. A je neco jednodussiho.

    Kamil
    31.7.2006 18:09 zabza | skóre: 52 | blog: Nad_sklenkou_cerveneho
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    tak dejte příklad, jak vypadá vstup a jak má vypadat výstup...
    31.7.2006 18:33 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Najdi ČEZ v html kodu

    ID_CENINA=11392 ČEZ td atd .. td class=815,16

    Ten html kod se me nepodarilo sem zapsat Pak vyber kurs tady 815,16 a treba vytiskni na obrazovku n. uloz do souboru. A to je vlastne vse Kamil
    31.7.2006 19:12 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Tady je to i s kodem http://tech.autohlavka.com/extrakce.html
    1.8.2006 02:06 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Ten html kod se me nepodarilo sem zapsat
    Nepodařilo se to kvůli zobáčkům?
    http://www.abclinuxu.cz/blog/johny/2006/8/1/142890
    1.8.2006 02:57 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Tento program
    #!/usr/bin/env python
    # -*- coding: iso-8859-2
    import re
    html = u'''
    ID_CENINA=11392'>ČEZ</a></td><td class="tr">815,16</td> ... -0,52
    '''
    id = u'ČEZ'
    regexp = re.compile(id + r'.*?(\d+(?:,\d+)?)')
    print regexp.search(html).groups()[0]
    
    Vypíše
    815,16
    1.8.2006 09:55 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Tohle funguje Jen se jeste snazim vyresit, aby to otevrelo soubor a obsah se predhodil tomu scriptu. S Pythonem se setkavam dnes poprve :-) neco jako ..

    #!/usr/bin/env python

    # -*- coding: iso-8859-2

    soubor = open('index.html','r')

    import re html = u'''soubor'''

    id = u'ČEZ' regexp = re.compile(id + r'.*?(\d+(?:,\d+)?)') print regexp.search(html).groups()[0]

    #Vypíše 815,16
    1.8.2006 10:20 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Zkusím hádat - ten index.html se předtím odněkud stáhl třeba wgetem a pak by se předal tomu skriptu. A co kdyby se to napsalo celé v pythonu včetně toho stahování? Třeba tohle
    #!/usr/bin/env python
    # -*- coding: iso-8859-2
    import re, urllib2
    id = 'ČEZ'
    regexp = re.compile(r'ID_CENINA=\d+.*' + id + r'.*?(\d+(?:,\d+)?)', re.DOTALL)
    url = 'http://tech.autohlavka.com/extrakce.html'
    html = urllib2.urlopen(url).read()
    print regexp.search(html).groups()[0]
    
    vypíše opět 815,16 ale tentokrát to stáhne html z tvé stránky.
    1.8.2006 10:27 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Ale kdybys to html chtěl opravdu číst ze souboru, tak stačí napsat
    html = file('index.html').read()
    
    1.8.2006 10:47 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    #!/usr/bin/env python

    # -*- coding: iso-8859-2

    import re

    html = file('index.html').read()

    id = u'ČEZ'

    regexp = re.compile(id + r'.*?(\d+(?:,\d+)?)')

    print regexp.search(html).groups()[0]

    Tohle me vraci .. Traceback (most recent call last): File "extr.pyth", line 7, in ? print regexp.search(html).groups()[0] AttributeError: 'NoneType' object has no attribute 'groups'
    1.8.2006 10:48 hm
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    proč to nepíšete v jazyce, který ovládáte?
    1.8.2006 10:50 kamil5 | skóre: 2
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Zda se ze to nefunguje, kdyz je to v php a html se musi vygenerovat http://tech.autohlavka.com/extrakce.html byl jen priklad
    1.8.2006 11:07 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: extrakce textu podle masky
    Bohužel jsem neměl k dispozici nic jiného než právě ten příklad, který jsi poslal. Na něm je to testováno.
    Tato diskuse už je ale moc košatá, takže jestli chceš nějaké řešení v Pythonu, ozvi se mi na mail (a kdyby z toho vzešlo něco přínosného, tak to sem napíšu). Jestli chceš raději zůstat u známějších nástrojů (jak psal hm), tak o tom už je zde IMHO informací dostatek.
    BTW, klientovi by mělo být úplně jedno, jestli je html statické nebo dynamické. A parsování HTML přes regulární výrazy je vždycky humus a spolehlivost je nepředvídatelná.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.