abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:22 | Nová verze

    Knihovna FFmpeg byla vydána ve verzi 8.0 „Huffman“. Přibyla mj. podpora hardwarově akcelerovaného kódování s využitím API Vulcan, viz seznam změn.

    Fluttershy, yay! | Komentářů: 0
    včera 17:44 | IT novinky

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) vydal Zprávu o stavu kybernetické bezpečnosti ČR za rok 2024 (pdf). V loňském roce NÚKIB evidoval dosud nejvíce kybernetických bezpečnostních incidentů s celkovým počtem 268. Oproti roku 2023 se však jedná pouze o drobný nárůst a závažnost dopadů evidovaných incidentů klesá již třetím rokem v řadě. V minulém roce NÚKIB evidoval pouze jeden velmi významný incident a významných incidentů bylo zaznamenáno 18, což oproti roku 2023 představuje pokles o více než polovinu.

    Ladislav Hagara | Komentářů: 1
    včera 13:55 | Komunita

    Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie). Servo mimo jiné nově zvládne animované obrázky APNG a WebP.

    Ladislav Hagara | Komentářů: 0
    včera 13:11 | IT novinky

    Na chytré telefony a počítačové tablety v Rusku bude od začátku příštího měsíce povinné předinstalovávat státem podporovanou komunikační aplikaci MAX, která konkuruje aplikaci WhatsApp americké společnosti Meta Platforms. Oznámila to dnes ruská vláda. Ta by podle kritiků mohla aplikaci MAX používat ke sledování uživatelů. Ruská státní média obvinění ze špehování pomocí aplikace MAX popírají. Tvrdí, že MAX má méně oprávnění k přístupu k údajům o uživatelích než konkurenční aplikace WhatsApp a Telegram.

    Ladislav Hagara | Komentářů: 28
    včera 04:22 | IT novinky

    Společnost PINE64 stojící za telefony PinePhone nebo notebooky Pinebook publikovala na svém blogu srpnový souhrn novinek. Kvůli nedostatečnému zájmu byla ukončena výroba telefonů PinePhone Pro.

    Ladislav Hagara | Komentářů: 1
    21.8. 22:22 | Nová verze

    Po pěti měsících vývoje byla vydána nová verze 0.15.1 programovacího jazyka Zig (GitHub, Wikipedie). Verze 0.15.0 byla přeskočena. Přispělo 162 vývojářů. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    21.8. 21:55 | Komunita

    Před sedmi lety společnost Valve představila fork projektu Wine s názvem Proton umožňující v Linuxu přímo ze Steamu hrát počítačové hry do té doby běžící pouze ve Windows. Aktuální přehled podporovaných her na stránkách ProtonDB

    Ladislav Hagara | Komentářů: 0
    21.8. 14:55 | IT novinky

    Společnost DuckDuckGo rozšířila svůj AI chat Duck.ai o GPT-5 mini (𝕏). Duck.ai umožňuje anonymní přístup bez vytváření účtů k několika modelům umělé inteligence. Aktuálně k GPT-4o mini, GPT-5 mini, Llama 4 Scout, Claude Haiku 3.5 a Mistral Small 3.

    Ladislav Hagara | Komentářů: 6
    21.8. 12:44 | Bezpečnostní upozornění

    Marek Tóth v příspěvku DOM-based Extension Clickjacking: Data ve správcích hesel v ohrožení na svém blogu popsal novou clickjacking techniku s několika variantami útoků a otestoval ji proti 11 správcům hesel. Výsledkem bylo nalezení několika 0-day zranitelností, které mohly ovlivnit uložená data desítek milionů uživatelů. Jedno kliknutí kdekoliv na webové stránce kontrolované útočníkem umožňovalo ukrást uživatelská data ze

    … více »
    Ladislav Hagara | Komentářů: 1
    20.8. 21:11 | IT novinky

    Na dnešní akci Made by Google 2025 (YouTube) byly představeny telefony Pixel 10 s novým čipem Google Tensor G5 a novými AI funkcemi, hodinky Pixel Watch 4 a sluchátka Pixel Buds 2a.

    Ladislav Hagara | Komentářů: 25
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (76%)
     (10%)
     (4%)
     (4%)
     (6%)
     (0%)
    Celkem 51 hlasů
     Komentářů: 6, poslední 21.8. 13:35
    Rozcestník

    Filtrujme čtivé texty z Projektu Gutenberg 5

    20. 4. 2016 | Karel Kulhavý | Návody | 10196×

    V minulém díle jsme viděli, jak i u jednoduchého unixového příkazu může vzniknout nečekaný problém při použití, zcela mimo doménu jeho působnosti. Existuje elegantní prevence takových omylů?

    Další možnost prevence je před zpracováním dat vytvořit vědeckou hypotézu o nich (žádný řádek nezačíná mezerou), a tu se pak pomocí experimentu snažit potvrdit nebo vyvrátit. Poslední dvě uvedené metody jsou ale komplexní a komplexitu práce s IT ještě zvyšují.

    Tento modelový incident je dle mého názoru pěknou ukázkou jevu, jak komplexní řešení (IT) problému (tužka a papír jsou příliš pomalé, neohrabané při posílání na dálku atd.) zanáší náš život komplexitou. Americký vědec, antropolog Dr. Joseph Tainter, profesor na Department of Environment and Society na Utah State University (vystudoval University of California Berkeley, známou např. OS BSD) tento jev zkoumá. Ve svých videopřednáškách (mirror) na YouTube vysvětluje, jak tato akumulace komplexity nakonec běžně způsobuje pády civilizací, které původně z této komplexity, sloužící k řešení problémů, profitovaly. A že z tohoto hlediska je naše civilizace v úplně typické fázi před kolapsem.

    Po odbočce k civilizačnímu nadhledu tento problém vyřešíme přídavným příkazem sed, který mezery na začátku řádku odfiltruje. Stříška značí začátek řádky. Při práci se sed, grep, awk apod. je třeba dávat pozor, že u každého příkazu je jinak, před které tyhle speciální znaky se dávají obrácená lomítka a před které ne, a také že shell ta obrácená lomítka někdy sní a někdy ne. Pokud je sní, musí se dát dvojitě. V našem případě jsme obrácená lomítka naštěstí nepotřebovali vůbec.

    sed -e 's/^ //g' clean.txt > clean2.txt

    A teď už může přijít zlatý hřeb: jak bývá dle mé zkušenosti typické pro Unix a Linux, s vynaložením neúměrného množství úsilí se nám konečně podařilo udělat jednoduchou věc, na kterou specificky existuje příkaz – odfiltrovat sedmý sloupec ze souboru:

    cut -f 7 -d ' ' clean2.txt
    
    4608764
    4315118
    597079
    274
    220594
    512351
    629627
    346597
    183018
    80
    328835
    60059
    427785
    871780
    3916362
    [...]

    Na zlatý hřeb už jen pověsíme pár dalších příkazů a objeví se nám statistika. -n říká, že čísla se mají řadit číselně a ne abecedně, 10 je tedy po 2 a ne před ní. uniq je z anglického unique, tedy „jedinečný“ – bere seřazený vstup, kde opakující se vstupy jsou v kuse za sebou, a z těch pustí vždy jen jeden. Přepínač -c ale způsobí, že se k tomu ještě navíc spočítá, kolik jich bylo. Dalšímu sortu řekneme, aby obrátil pořadí pomocí -r. Přepínač -k1 znamená klíč v prvním sloupci, tedy řadíme podle počtu opakování. A head -n 20 je tu proto, aby se nám hezky useklo jen prvních 20 řádek článku.

    $ cut -f 7 -d ' ' clean2.txt  |sort -n |uniq -c | sort -nrk1 | head -n 20
         23 11009
         15 12911
         13 21607
         12 12888
         12 12867
          9 1405
          9 12927
          9 12900
          9 12897
          9 12887
          8 21586
          8 12891
          8 12858
          7 12912
          7 12879
          7 12864
          6 59
          6 12906
          6 12905
          6 12890

    Teď by se mohlo zdát, že příkaz konečně proběhl, jak jsme chtěli, a nežádané komplexity IT jsme byli ušetřeni. Ale kde! Zdání klame! I zde si vychutnáme další neočekávaný úder z hlubin Tainterovy studijní oblasti. Ale jak budeme vůbec vědět odkud, když vše funguje, jak má? Úder přichází ze strany internacionalizace. Před určitým počtem let byl sen, že počítače budou moci mluvit světovými jazyky, a tak si dnes můžete nastavit, že vám bash bude psát chybové hlášky třeba vietnamsky nebo čínsky:

    ( for a in $(locale -a|grep -i utf); do LC_ALL="$a" . owhxeddo; done ) 2>&1 | sort | uniq

    Pilní čtenáři si mohou příkaz spustit za domácí úkol, ti ostatní se dozví, jak vypadají chybové hlášky ve všemožných jazycích, v příštím díle.

           

    Hodnocení: 50 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Diskuse byla administrátory uzamčena

    20.4.2016 12:34 Jouda
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Možná tomu správně nerozumím. Opravdu bylo věnováno tolik úsilí, aby byla nalezena složitá náhrada za toto? awk '{ print $7}' ./inputifile.txt | sort -nr | uniq -c

    Bojím se, o čem budou další díly, když triviálnímu triviálnímu součtu nad jedním sloupcem spolklo tolik řádek "úvah".
    20.4.2016 22:07 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5

    Kéž by… To úsilí bylo věnováno tomu, aby autor tím krkolomným postupem dosáhl toho, co by měl zadarmo, kdyby tři díly zpátky místo "-ls" napsal "-printf '%s\n'".

    Na druhou stranu, jak s oblibou říká moje tchýně, vychovávat je nejlépe osobním příkladem a nelze-li jinak, pak alespoň odstrašujícím. Takže, děti, tady názorně vidíte, jak to dopadá, když se místo použití vhodných nástrojů budete snažit parsovat výstup určený pro lidského čtenáře. :-)

    21.4.2016 10:42 Jouda
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Po přečtení tohoto dílu jsem se tak daleko do minulosti jít neodvážil. Nejspíš se ani neodvážím k otevření dalších budoucích dílů. Je to skoro jako scénář pro seriál TV Nova. :)
    21.4.2016 12:11 Jesus Jimenez | skóre: 29
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Však autor něco podobného zmiňuje sám :)

    A teď už může přijít zlatý hřeb: jak bývá dle mé zkušenosti typické pro Unix a Linux, s vynaložením neúměrného množství úsilí se nám konečně podařilo udělat jednoduchou věc, na kterou specificky existuje příkaz – odfiltrovat sedmý sloupec ze souboru

    Doaenův zákon průtahů: Čím pomaleji pracuješ, tím méně naděláš chyb. -- Murphy
    25.4.2016 14:59 Jouda
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Ve mě to spíš budí dojem, že neumí používat nástroje k tomu, k čemu jsou. Ono to možná není typické pro UX a LX. Spíš pro autora. :D
    25.4.2016 17:37 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    jasne, clock je hrozna lama :D
    So the Nationalists and the Socialists have the same policy on Brexit. They should get together and form a...
    21.4.2016 13:52 kolemjdouci
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Ja myslim, ze se v dalsich dilech objevi Vesmirni lide. To z toho odstavce o komplexite, ktery konci varovanim pred kolapsem, jasne cisi ...
    21.4.2016 06:41 x
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Tenhle seriál žeru! Esence unixového stylu humoru. Clock ve své životní formě. Worse is better!
    22.4.2016 11:56 koroptev
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    nastavuje zrcadlo, dekonstruuje stereotypy!
    26.2.2022 09:00 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I recently found many useful information in your website especially this blog page. Among the lots of comments on your articles. Thanks for sharing. omegle chat
    26.2.2022 11:24 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    The post is written in very a good manner and it contains many useful information for me. most of his career
    26.2.2022 11:41 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Very good points you wrote here..Great stuff...I think you've made some truly interesting points.Keep up the good work. Andrew Brooks Sinclair
    26.2.2022 11:42 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    You have a good point here!I totally agree with what you have said!!Thanks for sharing your views...hope more people will read this article!!! Andrew Brooks Sinclair
    26.2.2022 11:42 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I am happy to find your distinguished way of writing the post. Now you make it easy for me to understand and implement the concept. Thank you for the post. Gasthaus Graz
    26.2.2022 11:43 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Hello, I have browsed most of your posts. This post is probably where I got the most useful information for my research. Thanks for posting, maybe we can see more on this. Are you aware of any other websites on this subject. Andrew Brooks Sinclair
    28.2.2022 09:11 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Thank you for some other informative blog. Where else could I get that type of information written in such an ideal means? I have a mission that I’m just now working on, and I have been at the look out for such information. car show signs
    28.2.2022 12:59 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    thank you for your interesting infomation. shamanichealing
    28.2.2022 13:00 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Great job for publishing such a beneficial web site. Your web log isn’t only useful but it is additionally really creative too. There tend to be not many people who can certainly write not so simple posts that artistically. Continue the nice writing Georgia State University Housing
    28.2.2022 13:01 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I am very much pleased with the contents you have mentioned. I wanted to thank you for this great article.
    8.3.2022 12:56 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Fantastic blog! Do you have any tips and hints for aspiring writers? I’m planning to start my own website soon but I’m a little lost on everything. Would you propose starting with a free platform like WordPress or go for a paid option? There are so many options out there that I’m completely overwhelmed .. Any suggestions? Many thanks! chiropractic
    8.3.2022 12:59 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Thank you very much for writing such an interesting article on this topic. This has really made me think and I hope to read more. brake repair in Plainfield
    8.3.2022 13:01 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Nice to be visiting your blog again, it has been months for me. Well this article that i’ve been waited for so long. I need this article to complete my assignment in the college, and it has same topic with your article. Thanks, great share. towing service Naperville
    8.3.2022 13:02 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Thanks for taking the time to discuss that, I feel strongly about this and so really like getting to know more on this kind of field. Do you mind updating your blog post with additional insight? It should be really useful for all of us. Acupuncture
    9.3.2022 09:05 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Wow, cool post. I’d like to write like this too – taking time and real hard work to make a great article… but I put things off too much and never seem to get started. Thanks though. Haus on Handy Floor Plan
    12.3.2022 12:56 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I really loved reading your blog. It was very well authored and easy to understand. Unlike other blogs I have read which are really not that good.Thanks alot! Hauser Insurance
    12.3.2022 12:58 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    This is a brilliant blog! I'm very happy with the comments!.. Mark Hauser
    12.3.2022 13:00 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    This is very interesting content! I have thoroughly enjoyed reading your points and have come to the conclusion that you are right about many of them. You are great. Steph Korey
    12.3.2022 13:00 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Wonderful blog! I found it while surfing around on Yahoo News. Do you have any suggestions on how to get listed in Yahoo News? I’ve been trying for a while but I never seem to get there! Appreciate it. Miki Agrawal
    12.3.2022 13:03 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    It was wondering if I could use this write-up on my other website, I will link it back to your website though.Great Thanks. pest-control-salt-lake-city
    12.3.2022 13:03 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Thank you so much Love your blog.. Hauser Insurance
    12.3.2022 13:06 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    This is a great inspiring article.I am pretty much pleased with your good work.You put really very helpful information. Keep it up. Keep blogging. Looking to reading your next post. Mark Hauser
    12.3.2022 13:07 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Very interesting blog. Alot of blogs I see these days don't really provide anything that I'm interested in, but I'm most definately interested in this one. Just thought that I would post and let you know. Steph Korey
    12.3.2022 13:09 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Thanks for the nice blog. It was very useful for me. I'm happy I found this blog. Thank you for sharing with us,I too always learn something new from your post. Full spectrum PCR hemp oil
    12.3.2022 13:11 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    This is truly a great read for me. I have bookmarked it and I am looking forward to reading new articles. Keep up the good work!. Hauser Insurance
    12.3.2022 13:12 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    hi was just seeing if you minded a comment. i like your website and the thme you picked is super. I will be back. Mark Hauser
    12.3.2022 13:15 Kieran Miah
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I read your blog frequently and I just thought I’d say keep up the amazing work! Steph Korey
    16.6.2022 21:29 ELIZA
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I recently came across your blog and have been reading along. I thought I would leave my first comment. I don't know what to say except that I have enjoyed reading. Nice blog. I will keep visiting this blog very often. One Bernam Showflat



    I have a hard time describing my thoughts on content, but I really felt I should here. Your article is really great. I like the way you wrote this information. https://trippypharma.com/
    22.9.2023 16:51 ufa168
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I was looking for another article by chance and found your article I am writing on this topic, so I think it will help a lot. I leave my blog address below. Please visit once. ยูฟ่า168
    7.12.2023 13:26 ยูฟ่า168
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    I finally found magnificent post here.I will get back here. I just added your blog to my bookmark regions. thanks.Quality presents is the fundamental on welcome the visitors to visit the webpage page, that is the thing that this site page is giving. ยูฟ่า168
    27.12.2023 08:57 UFABET168GO
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    ufabet168 vip เว็บแทงบอลบริการครบครัน แทงบอลง่าย กำไรงาม
    10.2.2024 20:20 jonesswilsonn
    Rozbalit Rozbalit vše Peacocktv.com/tv - Enter Your Activation Code
    Peacock is among the streaming services that has caught the attention of a lot of people around the world. NBC Universal owns peacocktv.com/tv, the services offered include many films and TV shows accessible for streaming. A few of the popular and most well-known shows on the pop scene include Classics like the office and the cheers as well as current shows like Law and Order and This Is Us.

    peacocktv.com/tv peacocktv.com/tv
    26.2.2024 10:56 spam
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    Stream live TV with ABC, CBS, FOX, NBC, ESPN & top channels without cable. DVR included. Start watching free. No contract, cancel anytime. [url=https://www.peacock-tv-connect.com/]peacocktv.com/tv[/url]
    12.7. 13:45 Fabric
    Rozbalit Rozbalit vše Re: Filtrujme čtivé texty z Projektu Gutenberg 5
    It is really a nice and useful piece of information. I’m glad that you shared this useful info with us. Please keep us informed like this. บาคาร่า ออนไลน์
    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.