abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:00 | Zajímavý software

    Erin Catto, autor open source 2D fyzikálního enginu Box2D (Wikipedie), představil nový 3D fyzikální engine Box3D. Engine je již používán ve hře The Legend of California.

    Ladislav Hagara | Komentářů: 0
    dnes 01:00 | Nová verze

    Byla vydána nová verze 4.0.0 multiplatformního svobodného frameworku pro zpracování obrazu G'MIC (GREYC's Magic for Image Computing, Wikipedie). Přehled novinek i s náhledy nových filtrů na PIXLS.US.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | Zajímavý článek

    Český statistický úřad (ČSÚ): Průměrná hrubá měsíční mzda ICT specialistů v roce 2025 meziročně vzrostla o 6 % na téměř 100 tisíc korun. Nejlépe placeni byli vývojáři softwaru. Dlouhodobým trendem zůstává nízké zastoupení žen, a to jak mezi specialisty, tak studenty těchto oborů.

    Ladislav Hagara | Komentářů: 7
    včera 14:11 | IT novinky

    Ochranný svaz autorský (OSA) připravuje žalobu na společnost Suno, která umožňuje generování hudby pomocí umělé inteligence (AI). ČTK to sdělil předseda představenstva OSA Roman Strejček. Suno podle něj bez souhlasu využívá k trénování svých modelů hudbu autorů, které svaz zastupuje. Nedávný investigativní materiál magazínu The Atlantic ukázal, že firmy jako Suno nebo Udio k trénování modelů používají rozsáhlé databáze obsahující miliony skladeb. V databázích, které časopis zveřejnil, lze dohledat i písně řady českých a slovenských umělců.

    Ladislav Hagara | Komentářů: 2
    včera 13:33 | Komunita

    Byl publikován přehled dění a novinek z vývoje Asahi Linuxu, tj. Linuxu pro Apple Silicon. Vyřešen byl problém s macOS 27 Golden Gate. Vývoj lze podpořit na Open Collective a GitHub Sponsors.

    Ladislav Hagara | Komentářů: 0
    včera 12:55 | IT novinky

    EU dnešním dnem zavedla clo ve výši 3 eur na balíky nízké hodnoty dovážené ze zemí mimo EU. To zahrnuje širokou škálu výrobků běžně nakupovaných on-line, jako jsou oděvy, hračky, elektronika a další spotřební zboží v hodnotě až 150 EUR.

    Ladislav Hagara | Komentářů: 4
    včera 08:55 | Nová verze

    Vyšel Redmine 7.0, jeden z nejlepších open source ticketovacích systémů. Došlo k migraci na Rails 8, vylepšení UI/UX, Workflow, byla přidána podpora náhledu pro Microsoft Office a LibreOffice dokumenty, došlo k výkonnostním optimalizacím a přibylo spoustu dalších oprav a novinek. Více informací v oficiálním oznámení.

    Max | Komentářů: 0
    30.6. 16:22 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 166 (pdf).

    Ladislav Hagara | Komentářů: 0
    30.6. 03:33 | Pozvánky

    Blíží se prázdniny a než se rozutečete k moři, je na čase se opět sejít na Virtuální Bastlírně - pravidelném setkání elektroniků, ajťáků, bastlířů a obecně nadšenců do techniky. Co si pro vás strahovští bastlíři připravili tentokrát? Určitě proberou blížící se Linux Days i další události. U softwaru se chvíli zdrží a poví si kupříkladu o tom, jak se zbavit Bambu Cloudu, ale nepřijít o možnost ovládat tiskárnu na dálku. Řeč dojde i na AI,

    … více »
    bkralik | Komentářů: 0
    30.6. 03:22 | Nová verze

    Vývojáři postmarketOS vydali verzi 26.06 tohoto operačního systému pro chytré telefony vycházejícího z optimalizovaného a nakonfigurovaného Alpine Linuxu s vlastními balíčky. Přehled novinek v příspěvku na blogu. Na výběr jsou 4 uživatelská rozhraní: GNOME, KDE Plasma Mobile, Phosh a Sxmo.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (17%)
     (31%)
     (4%)
     (6%)
     (2%)
     (16%)
     (26%)
    Celkem 2031 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: XML a grep

    25.9.2021 11:43 Paulus | skóre: 15 | Jihlava
    XML a grep
    Přečteno: 498×
    Dobrý den, hledám nějaký konzolový nástroj, který by mi pro XML dovedl vrátit všechny kompletní záznamy, které obsahují hledaný text.

    U přiloženého souboru bych chtěl všechny elementy Subjekt, které budou obsahovat konkrétní IČa. (např 72063271 a 65018826). Ale budu hledat i text, který může mít různé tagy.

    Řešení dotazu:


    Odpovědi

    25.9.2021 11:52 Paulus | skóre: 15 | Jihlava
    Rozbalit Rozbalit vše Re: XML a grep
    Příloha se bohužel nenahrála. Je tady tady (600 kB, jsou to open data z obchodního rejstříku).
    Řešení 2× (d.c., MakeIranBombedAgain❗)
    25.9.2021 12:21 X
    Rozbalit Rozbalit vše Re: XML a grep
    Na zpracovani XML grep fakt ne. Daleko pohodlnejsi je pouzit XML parser a XPATH. Priklad v Pythonu:
    #!/usr/bin/python3
    
    from lxml import etree
    
    with open('zajzdrpo-full-ceske_budejovice-2021.xml', 'rb') as f:
            root = etree.parse(f)
            print(root.xpath('./Subjekt[ico = 4163311]'))
    
    MakeIranBombedAgain❗ avatar 25.9.2021 20:54 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
    Rozbalit Rozbalit vše Re: XML a grep

    víc krásnější je beautifulsoup která taky umí dělat s lxml parserem hele :O ;D

    MakeIranBombedAgain❗ avatar 25.9.2021 21:03 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
    Rozbalit Rozbalit vše Re: XML a grep
    #!/usr/bin/env python3
    
    from bs4 import BeautifulSoup
    import argparse
    
    # suběkt jakoby musí mit všecky iča nebo stačí aspoň jedno??????? :O :O
    def najdi_subjekty(subjekty, ica):
        nalezene_subjekty = []
        for sub in subjekty:
            ico = int(sub.find("ico").text)
            if ico in ica:
                nalezene_subjekty.append(sub)
    
        return nalezene_subjekty
    
    
    if __name__ == "__main__":
    
        parser = argparse.ArgumentParser()
        parser.add_argument(
            "-n", "--nazev", help="*.xml co se prohledavaj", required=True, type=str
        )
        parser.add_argument(
            "-i",
            "--ica",
            nargs="+",
            help="všecky ty ica co se jakoze hledaj",
            required=True,
            type=int,
        )
        args = parser.parse_args()
    
        with open(args.nazev, "r") as file:
    
            xml = BeautifulSoup(file.read(), "lxml")
            subjekty = xml.find_all(
                "subjekt"
            )  # musíme napsat malý první písmenko do názvu tagu :O :O
            subs = najdi_subjekty(subjekty, args.ica)
    
            print(f"nalezeno {len(subs)} subektu z celkovyho poctu {len(subjekty)}")
            for sub in subs:
                print("-" * 80)
                print(sub.prettify())
    

    a použije se to jakoby takle třeba

    ./skript.py -n zajzdrpo-full-ceske_budejovice-2021.xml -i 75138514
    25.9.2021 12:36 Kit | skóre: 46 | Brno
    Rozbalit Rozbalit vše Re: XML a grep
    xgrep, XQilla nebo XMLStarlet.
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    Řešení 1× (MakeIranBombedAgain❗)
    xkucf03 avatar 25.9.2021 21:49 xkucf03 | skóre: 50 | blog: xkucf03
    Rozbalit Rozbalit vše Re: XML a grep
    cat zajzdrpo-full-ceske_budejovice-2021.xml \
        | relpipe-in-xmltable \
            --relation 'subjekt' \
                --records '//Subjekt[ico="72063271" or ico="65018826"]' \
                --attribute 'ičo'   string 'ico' \
                --attribute 'název' string 'nazev' \
                --attribute 'xml'   string '.' --mode raw-xml \
        | relpipe-out-tabular | less -RSi
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    25.9.2021 23:19 X
    Rozbalit Rozbalit vše Re: XML a grep
    Suggestions: Bylo by mozne to kompilovat jako samostatnou binarku pod nazvem 'relpipe', ktera by byla parametrizovatelna a zahrnovala vsechny varianty? Takovy "I/O svicarsky nuz", ale na datove soubory? Takto, jak je to dlouhe a nasekane na jednotlive komponenty(relpipe-in-xml,relpipe-in-csv..) je zdlouhave na vypisovani, ale:
    relpipe -in json .. | relpipe -out csv ..
    relpipe --xml ..
    
    bych fakt bral jako hodne super. Zaroven tam nevidim relpipe-in-json. hodou okolnosti XML/CSV/JSON hodne pouzivam a vypisovat to v Python je pro jednorazove ucely otrava. Dobra prace!
    xkucf03 avatar 25.9.2021 23:59 xkucf03 | skóre: 50 | blog: xkucf03
    Rozbalit Rozbalit vše Re: XML a grep + Relational pipes
    Bylo by mozne to kompilovat jako samostatnou binarku pod nazvem 'relpipe', ktera by byla parametrizovatelna a zahrnovala vsechny varianty? Takovy "I/O svicarsky nuz", ale na datove soubory? Takto, jak je to dlouhe a nasekane na jednotlive komponenty(relpipe-in-xml,relpipe-in-csv..) je zdlouhave na vypisovani

    Teoreticky by šlo udělat nějaký metamodul, který by sesypal všechny zdrojáky dohromady a udělal z toho jednu binárku (za cenu toho, že to přestane být modulární a bude to záviset na všech knihovnách). Ale spíš jsem si říkal, že by to bylo lepší řešit formou skriptu.

    Ať tak či tak, v obou případech je trochu problém, jak navrhnout to CLI rozhraní. Když je to rozdělené na vstup, transformaci a výstup a oddělené | rourami, tak je jasné, který parametr patří ke kterému příkazu/modulu. Pokud to bude v jednom, tak můžou některé volby kolidovat, nebude to tak přehledné a asi by bylo potřeba k těm parametrům přidat nějaké prefixy.

    Co se týče jednoduchých konverzí z jednoho formátu do druhého, tak mám např. připravený skript 2xml, na který si stačí udělat symlink, např. json2xml, ini2xml, asn12xml atd. A pak má člověk v jednom krátkém příkazu všechno. Bude to zdokumentované v příští verzi. Podobně může vzniknout např. json2csv atd.

    Spíš ale očekávám, že si uživatelé budou psát takové skripty ad-hoc podle svých potřeb, protože napsat to univerzálně je dost komplikované (viz výše).

    Nechávám to zatím otevřené – pokud se najde způsob, jak to udělat dostatečně univerzálně a zároveň přehledně, tak by takový švýcarský nůž byl fajn.

    Zaroven tam nevidim relpipe-in-json. hodou okolnosti XML/CSV/JSON hodne pouzivam a vypisovat to v Python je pro jednorazove ucely otrava.

    V té příští verzi (v0.18) bude relpipe-in-yamlrelpipe-in-yamltable a protože JSON lze považovat za podmnožinu YAMLu, ten parser si poradí i s JSONem a budou tam připravené symlinky relpipe-in-jsonrelpipe-in-jsontable. Ten první očekává pevně danou strukturu (jedna nebo více relací), např.

    "x11_input_device":
      "attribute-metadata":
        - "name": "id"
          "type": "integer"
        - "name": "name"
          "type": "string"
        - "name": "type"
          "type": "string"
      "record":
        - "id": 8
          "name": "Power Button"
          "type": "keyboard"
        - "id": 10
          "name": "Logitech USB Trackball"
          "type": "mouse"
        - "id": 16
          "name": "AT Translated Set 2 keyboard"
          "type": "keyboard"

    nebo:

    {
       "x11_input_device": {
          "attribute-metadata": [
             {
                "name": "id",
                "type": "integer"
             },
             {
                "name": "name",
                "type": "string"
             },
             {
                "name": "type",
                "type": "string"
             }
          ],
          "record": [
             {
                "id": 8,
                "name": "Power Button",
                "type": "keyboard"
             },
             {
                "id": 10,
                "name": "Logitech USB Trackball",
                "type": "mouse"
             },
             {
                "id": 16,
                "name": "AT Translated Set 2 keyboard",
                "type": "keyboard"
             }
          ]
       }
    }

    A ten druhý (relpipe-in-*table) bere libovolnou stromovou strukturu v daném formátu a umožňuje nad ní pouštět XPath dotazy a vygenerovat jednu nebo více relací. První XPath dotaz vybírá záznamy a další XPath dotazy (relativní k výsledkům toho prvního) pak vybírají atributy těch záznamů. V té v0.18 budou podporované kromě standardního XML i YAML, JSON, HTML, INI, ASN.1, CBOR a MIME (e-mailové zprávy). Ten HTML modul se může hodit k vytěžování strukturovaných informací z různých webů – ten parser přečte i nevalidní a všelijak zprasené HTML, postaví se z toho normální DOM a nad ním už lze kouzlit s XPath dotazy, jak je člověk zvyklý z XML.

    Ještě to zbývá trochu doladit a zdokumentovat, ale ve zdrojácích už to je. Předběžný instalační skript: release-v0.18.sh (v Mercurialu ještě není štítek v0.18, takže to bere tip – nejnovější verzi všeho). Pokud to někdo otestuje ještě před vydáním, budu jedině rád.

    Osobně ten asn12xml už nějakou dobu používám pro ladění X.509 certifikátů, P7 podpisů, P12 klíčenek (obecně PKI věcí).

    Dobra prace!

    Díky

    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.