abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 23:33 | Nová verze

    Immich byl vydán v první stabilní verzi 2.0.0 (YouTube). Jedná se o alternativu k výchozím aplikacím od Googlu a Applu pro správu fotografií a videí umožňující vlastní hosting serveru Immich. K vyzkoušení je demo. Immich je součástí balíčků open source aplikací FUTO. Zdrojové kódy jsou k dispozici na GitHubu pod licencí AGPL-3.0.

    Ladislav Hagara | Komentářů: 0
    včera 22:33 | IT novinky

    Český telekomunikační úřad vydal zprávy o vývoji cen a trhu elektronických komunikací se zaměřením na rok 2024. Jaká jsou hlavní zjištění? V roce 2024 bylo v ČR v rámci služeb přístupu k internetu v pevném místě přeneseno v průměru téměř 366 GB dat na jednu aktivní přípojku měsíčně – celkově jich tak uživateli bylo přeneseno přes 18 EB (Exabyte). Nejvyužívanějším způsobem přístupu k internetu v pevném místě zůstal v roce 2024 bezdrátový

    … více »
    Ladislav Hagara | Komentářů: 0
    včera 12:11 | Nová verze

    Raspberry Pi OS, oficiální operační systém pro Raspberry Pi, byl vydán v nové verzi 2025-10-01. Přehled novinek v příspěvku na blogu Raspberry Pi a poznámkách k vydání. Jedná o první verzi postavenou na Debianu 13 Trixie.

    Ladislav Hagara | Komentářů: 0
    včera 05:22 | Nová verze

    Byla vydána nová verze 4.6 svobodného notačního programu MuseScore Studio (Wikipedie). Představení novinek v oznámení v diskusním fóru a také na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 02:22 | Komunita

    Společnost DuckDuckGo stojící za stejnojmenným vyhledávačem věnovala 1,1 milionu dolarů (stejně jako loni) na podporu digitálních práv, online soukromí a lepšího internetového ekosystému. Rozdělila je mezi 29 organizací a projektů. Za 15 let rozdala 8 050 000 dolarů.

    Ladislav Hagara | Komentářů: 4
    1.10. 20:11 | Nová verze

    Svobodný multiplatformní herní engine Bevy napsaný v Rustu byl vydán ve verzi 0.17. Díky 278 přispěvatelům.

    Ladislav Hagara | Komentářů: 0
    1.10. 16:11 | Nová verze

    Bylo vydáno openSUSE Leap 16 (cs). Ve výchozím nastavení přichází s vypnutou 32bitovou (ia32) podporou. Uživatelům však poskytuje možnost ji ručně povolit a užívat si tak hraní her ve Steamu, který stále závisí na 32bitových knihovnách. Změnily se požadavky na hardware. Leap 16 nyní vyžaduje jako minimální úroveň architektury procesoru x86-64-v2, což obecně znamená procesory zakoupené v roce 2008 nebo později. Uživatelé se starším hardwarem mohou migrovat na Slowroll nebo Tumbleweed.

    Ladislav Hagara | Komentářů: 3
    1.10. 16:00 | IT novinky

    Ministerstvo průmyslu a obchodu (MPO) ve spolupráci s Národní rozvojovou investiční (NRI) připravuje nový investiční nástroj zaměřený na podporu špičkových technologií – DeepTech fond. Jeho cílem je posílit inovační ekosystém české ekonomiky, rozvíjet projekty s vysokou přidanou hodnotou, podpořit vznik nových technologických lídrů a postupně zařadit Českou republiku mezi země s nejvyspělejší technologickou základnou.

    … více »
    Ladislav Hagara | Komentářů: 3
    1.10. 12:55 | Nová verze

    Radicle byl vydán ve verzi 1.5.0 s kódovým jménem Hibiscus. Jedná se o distribuovanou alternativu k softwarům pro spolupráci jako např. GitLab.

    Ladislav Hagara | Komentářů: 3
    1.10. 03:22 | IT novinky

    Společnost OpenAI představila text-to-video AI model Sora 2 pro generování realistických videí z textového popisu. Přesnější, realističtější a lépe ovladatelný než předchozí modely. Nabízí také synchronizované dialogy a zvukové efekty.

    Ladislav Hagara | Komentářů: 4
    Jaké řešení používáte k vývoji / práci?
     (41%)
     (47%)
     (15%)
     (16%)
     (18%)
     (14%)
     (17%)
     (14%)
     (14%)
    Celkem 158 hlasů
     Komentářů: 9, poslední 24.9. 17:28
    Rozcestník

    Standardní knihovna pro Python - 8 (regulární výrazy 1)

    10. 4. 2007 | Jakub Matys | Programování | 12149×

    Regulární výrazy představují moderní, výkonnou a komplexní metodu pro prohledávání řetězců. Není divu, že mnoho jazyků práci s regulárními výrazy podporuje. Ani Python není výjimkou...

    Regulární výraz (regular expression) je řetězec popisující celou množinu řetězců, neboli předpis pro podobné řetězce. Regulární výrazy programátorovi usnadní složitější prohledávání řetězců např. při kontrole vstupů nebo při parsování kódu (HTML, konfigurační soubory). Pokud chce uživatel v textu vyhledat nějaký řetězec, který nezná přesně, může zadat regulární výraz. Program pak nalezne všechny části textu, které danému výrazu odpovídají. Regulární výrazy v Pythonu pracují podobně jako zástupné znaky * a ? v shellu (místo * je možné vložit jakékoliv množství znaků, místo ? se vkládá jen jeden znak), mají však komplexnější využití.

    Ve verzi 1.5 byla do Pythonu přidána podpora regulárních výrazů ve stylu Perl. Ta je zajišťována modulem re. V předchozích verzích byly regulární výrazy dostupné také, ale jednalo se o výrazy v emacsovém stylu (modul regex). Vzor regulárních výrazů je vždy zkompilován do byte kódu, který je poté zpracován srovnávacím kódem napsaným v jazyce C.

    Vzhledem k tomu, že regulární výrazy často využívají speciální znaky a zpětné lomítko, je vhodné je zapisovat jako tzv. raw řetězce (r'\n' == '\\n').

    Základní syntaxe regulárních výrazů

    Vzory regulárních výrazů se skládají z obyčejných znaků, které mají normální význam (např. "jméno", "Petr" atp.), a tzv. metaznaků. Jedná se o znaky, které mají speciální význam:

    • . - tečka - vyhledá jakýkoliv znak kromě přechodu na nový řádek.
    • ^ - vyhledá začátek řetězce.
    • $ - vyhledá konec řetězce.
    • [...] - vyhledá jeden ze znaků definovaných uvnitř hranatých závorek, např. r"[abcABC]" nebo r"[a-zA-Z]". Speciální znaky nemají uprostřed množiny svůj standardní význam.
    • [^...] - v daném místě se má vyskytovat jeden libovolný znak, vyjma znaků definovaných mezi závorkami.
    • | - A|B vyhledá A nebo B, kde A a B jsou regulární výrazy.
    • kvantifikátory - určují, kolikrát se smí předchozí znak opakovat.
      • * - vyhledá nulové nebo více opakování předcházejícího výrazu, vybere co nejvíce opakování.
      • + - vyhledá jedno nebo více opakování předcházejícího výrazu, vybere co nejvíce opakování.
      • ? - vyhledá nulové nebo jedno opakování předcházejícího výrazu.
      • *? - vyhledá nulové nebo více opakování výrazu, ale vybere co nejméně opakování.
      • +? - vyhledá jedno nebo více opakování výrazu, ale vybere co nejméně opakování.
      • ?? - vyhledá nulové nebo jedno opakování, přičemž vybere co nejméně opakování.
      • {m, n} - vyhledá opakování předcházejícího výrazu od m do n-krát, vybere co nejvíce opakování.
      • {m, n}? - vyhledá opakování předcházejícího výrazu od m do n-krát, vybere co nejméně opakování.

    Potřebujete-li vyhledávat metaznak v jeho původním významu, můžete jej zpřístupnit přes zpětné lomítko (escapování).

    Dále pak regulární výrazy v Pythonu umožňují pracovat se skupinami a obsahují speciálně předdefinované skupiny znaků - obojí si ukážeme v příštím díle.

    Nutnou dávku teorie máme za sebou. Ukažme si nejdříve, jak se vlastně s regulárními výrazy pracuje:

    >>> import re
    >>> retezec1 = "abcde"
    >>> retezec2 = "123"
    >>> vzor = re.compile(r"a+")
    >>> vzor.match(retezec1)
    <_sre.SRE_Match object at 0xb7bdf4b8>
     # pri nalezeni shody se vraci objekt Match, se kterym lze dale pracovat
    >>> vzor.match(retezec2)
     # v pripade,ze nebyla nalezena shoda, vraci None
    >>> re.match(r"[1-9]+?", retezec2)
    <_sre.SRE_Match object at 0xb7bdf560>
    

    Jak je vidět, můžeme vzor nejdříve sami zkompilovat, což je vhodné při opakovaném porovnávání. V tomto případě voláme metody vráceného objektu. Funkce compile() může obsahovat ještě kombinaci parametrů, které se oddělují bitovým or ("|"):

    • I nebo IGNORECASE - nerozlišuje malá a velká písmena.
    • L nebo LOCALE - lokalizuje parametry \w, \W, \b a \B.
    • M nebo MULTILINE - ^ a $ se budou vztahovat na každý řádek řetězce, ne jen na jeho začátek a konec.
    • S nebo DOTALL - tečka (".") odpovídá všem znakům, včetně přechodu na nový řádek.
    • U nebo UNICODE - pro \w, \W, \b a \B nastaví Unicode rozšíření.
    • X nebo VERBOSE - ignoruje komentáře a neviditelné znaky.

    Můžeme také volat funkci modulu re, které předáme pouze nezkompilovaný "raw string". Funkci je pak možné předávat stejné parametry jako výše. Modul obsahuje více funkcí (objekt zkompilovaného vzoru pak více metod); pro začátek se však omezíme pouze na match(). Na ostatní se zaměříme v dalších dílech.

    Na závěr si předveďme několik příkladů, aby bylo jasně vidět, jak se zapisují vzory regulárních výrazů.

    re.match(r"a+", retezec) # vyhleda 1 a vice znaku a
    re.match(r"a*", retezec) # vyhleda 0 a vice znaku a
    re.match(r"o?kov", retezec) # vyhleda okov nebo kov
    re.match(r"tel(efon)?$", retezec)
     # vyhleda tel nebo telefon na konci retezce
    re.match(r"^[0-9]{2}$", retezec)
     # vyhleda dvouciferne desitkove cislo (00 az 99),
     #+ktere je jedinym obsahem retezce
    re.match(r"[0-9a-fA-F]|[1-9a-fA-F][0-9a-fA-F]+", retezec)
     # vyhledava hexadecimalni cisla
    re.match(r"(19|20)[0-9]{2}", retezec)
     # vyhleda letopocet mezi roky 1900 a 2099
    re.match(r"a\+b", retezec) # vyhleda 'a+b'
    
           

    Hodnocení: 100 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Jiří P. avatar 10.4.2007 09:40 Jiří P. | skóre: 24 | blog: programování
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    Pro skládání reg. výrazů a jejich odladění se mi velice osvědčil prográmek kodos.
    In a world without fences and walls, who needs Gates and Windows?
    10.4.2007 10:17 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    re.match(r"(19|20)[0-9]{2}", retezec)
     # vyhleda letopocet mezi roky 1900 a 2050
    
    hmm, možno tak v pythone :-)) Všade inde by bolo treba opraviť buď prvý riadok
    m/(?:19\d{2})|(?:20[0-4]\d)|2050/
    
    alebo druhý riadok
     # vyhleda letopocet mezi roky 1900 a 2099 (vrátane)
    
    10.4.2007 14:26 Jakub Matys
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    Omlouvam se - chybicka se vloudila. V komentari melo opravdu byt 1900 az 2099.
    10.4.2007 14:38 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    btw, aj tie hexa čísla sú nejaký zvláštny regexp. Autor mohol predviesť ignore-case match :-)
    m/^(?:0|(?!0)[0-9a-f]+)$/i
    
    mj41 avatar 10.4.2007 18:13 mj41 | skóre: 17 | blog: mj41 | Brno
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    Jak se da v Pythonu jednoduse udelat Perlovske:

    die "Zadany retezec neobsahuje letopocet od 1900 do 2099.\n" if $retezec !~ /(19|20)[0-9]{2}/;

    ?
    10.4.2007 20:26 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    třeba takhle
    #!/usr/bin/env python
    import re
    year_str = '1801d'
    if not re.match('(19|20)[0-9]{2}', year_str):
        raise SystemExit, 'Chyba formatu letopoctu'
    
    nebo takhle
    year_str = '1801d'
    try:
        rok = int(year_str)    
    except ValueError:
        raise SystemExit, '"%s" nelze prevest na cislo.' %year_str
    
    if rok < 1900 or rok > 2099:
        raise SystemExit, 'Rok %d je mimo interval 1900 a 2099.' %rok
    
    11.4.2007 13:37 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    Afaik volání die prostě ukončí interpreter Perlu, takže v Pythonu by tomu odpovídalo exit. Výjimka se dá pomocí except zachytit a zpracovat ... <rejp>
    Při vyvolávání výjimky si typicky objekt reprezentující výjimku vytvářím -- doporučuje se zápis vyjadřující konstrukci nového objektu ;-)
    py.cz
    </rejp>
    When your hammer is C++, everything begins to look like a thumb.
    10.12.2021 12:03 ahmedsayeed1982
    Rozbalit Rozbalit vše Re: Standardní knihovna pro Python - 8 (regulární výrazy 1)
    some periods, Nvidia can squeeze new ones among the existing card models. In such cases, the newly announced graphics card(s) are slightly more powerful than the cards of the same model. Nvidia has leaked graphics card a new graphics card model, in the 497.09 graphics card driver version. The new graphics card was leaked in the patch notes of the 497.09 driver published on Nvidia's site on Wednesday. It turned out that Nvidia's new graphics card model, the 12 GB RTX Nvidia's site 2060 Super, is supported with the 497.09 driver. Although Nvidia has not officially introduced the graphics card yet, the phrase in the patch notes winks at the future of a new graphics card. You can see the statement GeForce RTX 2060 of GeForce RTX 2060 12 GB graphics card on page 8 of the PDF at this link. Nvidia introduced some RTX 2060 Super offerings to the market in early 2021. The company did not perform a promotion for users, their purpose was only to survey RTX Super 2060 the market. Meanwhile, Nvidia continued to produce RTX 3000 series cards. For a long time, rumors of a 12GB RTX 2060 variant had excited users. Some rumors that appeared on Twitter and YouTube also pointed to the future of the new graphics Nvidia card. Still, users preferred to approach the rumors carefully. Since then, this new graphics card has remained a rumor until Nvidia's minor bug was revealed. Although Nvidia has not yet officially announced the 12 GB RTX 2060 12 GB RTX 2060 Super graphics card, the phrase in the PDF gives a certainty to the graphics card. Normally, RTX 2060 Super models have 8 GB of VRAM, and this new 12 GB model will be able to offer wider usage areas. The price and availability of the new graphics card are not yet known. It is also unknown whether Nvidia Nvidia card is planning a launch for the card. It is thought that Nvidia made this leak on purpose to prepare the market for the new graphics card. Since then, this new graphics card has remained a rumor until the minor error that Nvidia new graphics card made was revealed. Although Nvidia has not yet officially announced the 12 GB RTX 2060 Super graphics card, the phrase in the PDF gives a certainty to the graphics card. Normally, RTX 2060 Super models have 8 GB of VRAM, and this new 12 GB model will be able to offer wider usage areas. 12 gb graphics card The price and availability of the new graphics card are not yet known. It is also unknown whether Nvidia is planning a launch for the card. It is thought that Nvidia deliberately made this leak to prepare the market for the new graphics card. The price and availability of the new graphics card are not yet known. It is also unknown whether latest graphics card Nvidia is planning a launch for the card. It is thought that Nvidia deliberately made this leak to prepare the market for the new graphics card. In some periods, Nvidia can squeeze new ones among the existing card models. In such cases, the newly announced graphics card(s) are slightly more powerful than the cards Nvidia and amd of the same model. Nvidia has leaked a new graphics card model, in the 497.09 graphics card driver version. The new graphics card was leaked in the patch notes of the 497.09 driver published on Nvidia's site on Wednesday. It turned out that Nvidia's new graphics card model, the 12 GB RTX 2060 Amd graphics card Super, is supported with the 497.09 driver. Although Nvidia has not officially introduced the graphics card yet, the phrase in the patch notes winks at the future of a new graphics card. You amd graphics can see the statement of GeForce RTX 2060 12 GB graphics card on page 8 of the PDF at this link. Nvidia introduced some RTX 2060 Super offerings to the market in early 2021. The company did not perform a promotion for users, their purpose was only to survey the market. Meanwhile, Nvidia continued to produce RTX 3000 series cards. For rtx 2060 a long time, rumors of a 12GB RTX 2060 variant had excited users. Some rumors that appeared on Twitter and YouTube also pointed to the future of the new graphics card. Still, users preferred to approach the rumors carefully. Since then, this new graphics card super rtx has remained a rumor until Nvidia's minor bug was revealed. Although Nvidia has not yet officially announced the 12 GB RTX 2060 Super graphics card, the phrase in the PDF gives a certainty to the graphics card. Normally, RTX 2060 Super models rtx 2060 super have 8 GB of VRAM, and this new 12 GB model will be able to offer wider usage areas. The price and availability of the new graphics card are not yet known. It is also unknown whether Nvidia is planning a launch for the card. It is thought that Nvidia made this leak on purpose to prepare the market for the new graphics card. Nvidia Since then, this new graphics card has remained a rumor until the minor error that Nvidia made was revealed. Although Nvidia has not yet officially announced the 12 GB RTX 2060 Super graphics card, the phrase in the PDF gives a certainty to the graphics card. Normally, RTX 2060 super graphics cards Super models have 8 GB of VRAM, and this new 12 GB model will be able to offer wider usage areas. The price and availability of the new graphics card are not yet known. It is also unknown whether Nvidia is planning a launch for the card. It is thought that Nvidia deliberately made this leak to prepare the market for the new graphics card. The price graphics cards 2021 and availability of the new graphics card are not yet known. It is also unknown whether Nvidia is planning a launch for the card. It is thought that Nvidia deliberately made this leak to prepare the market for the new graphics card.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.