abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:33 | Pozvánky

    Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 211. sraz, který proběhne v pátek 19. září od 18:00 ve Studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Na srazu proběhne přednáška Jiřího Eischmanna o nové verzi prostředí GNOME 49. Nemáte-li možnost se zúčastnit osobně, přednáškový blok bude opět streamován živě na server VHSky.cz a následně i zpřístupněn záznam.

    Ladislav Hagara | Komentářů: 0
    dnes 01:33 | IT novinky

    Microsoft se vyhnul pokutě od Evropské komise za zneužívání svého dominantního postavení na trhu v souvislosti s aplikací Teams. S komisí se dohodl na závazcích, které slíbil splnit. Unijní exekutivě se nelíbilo, že firma svazuje svůj nástroj pro chatování a videohovory Teams se sadou kancelářských programů Office. Microsoft nyní slíbil jasné oddělení aplikace od kancelářských nástrojů, jako jsou Word, Excel a Outlook. Na Microsoft si

    … více »
    Ladislav Hagara | Komentářů: 3
    včera 14:00 | Nová verze

    Samba (Wikipedie), svobodná implementace SMB a Active Directory, byla vydána ve verzi 4.23.0. Počínaje verzí Samba 4.23 jsou unixová rozšíření SMB3 ve výchozím nastavení povolena. Přidána byla podpora SMB3 přes QUIC. Nová utilita smb_prometheus_endpoint exportuje metriky ve formátu Prometheus.

    Ladislav Hagara | Komentářů: 0
    včera 12:00 | Zajímavý článek

    Správcovský tým repozitáře F-Droid pro Android sdílí doporučení, jak řešit žádosti o odstranění nelegálního obsahu. Základem je mít nastavené formální procesy, vyhrazenou e-mailovou adresu a být transparentní. Zdůrazňují také důležitost volby jurisdikce (F-Droid je v Nizozemsku).

    🇵🇸 | Komentářů: 20
    včera 05:33 | Bezpečnostní upozornění

    Byly publikovány informace o další zranitelnosti v procesorech. Nejnovější zranitelnost byla pojmenována VMScape (CVE-2025-40300, GitHub) a v upstream Linuxech je již opravena. Jedná se o variantu Spectre. KVM host může číst data z uživatelského prostoru hypervizoru, např. QEMU.

    Ladislav Hagara | Komentářů: 0
    11.9. 22:00 | Komunita

    V červenci loňského roku organizace Apache Software Foundation (ASF) oznámila, že se částečně přestane dopouštět kulturní apropriace a změní své logo. Dnes bylo nové logo představeno. "Indiánské pírko" bylo nahrazeno dubovým listem a text Apache Software Foundation zkratkou ASF. Slovo Apache se bude "zatím" dál používat. Oficiální název organizace zůstává Apache Software Foundation, stejně jako názvy projektů, například Apache HTTP Server.

    Ladislav Hagara | Komentářů: 14
    11.9. 17:33 | Nová verze

    Byla vydána (𝕏) srpnová aktualizace aneb nová verze 1.104 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.104 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 1
    11.9. 15:33 | IT novinky

    Spotify spustilo přehrávání v bezztrátové kvalitě. V předplatném Spotify Premium.

    Ladislav Hagara | Komentářů: 0
    11.9. 15:00 | IT novinky

    Spoluzakladatel a předseda správní rady americké softwarové společnosti Oracle Larry Ellison vystřídal spoluzakladatele automobilky Tesla a dalších firem Elona Muska na postu nejbohatšího člověka světa. Hodnota Ellisonova majetku díky dnešnímu prudkému posílení ceny akcií Oraclu odpoledne vykazovala nárůst o více než 100 miliard dolarů a dosáhla 393 miliard USD (zhruba 8,2 bilionu Kč). Hodnota Muskova majetku činila zhruba 385 miliard dolarů.

    Ladislav Hagara | Komentářů: 7
    10.9. 21:22 | Nová verze

    Bylo vydáno Eclipse IDE 2025-09 aneb Eclipse 4.37. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (82%)
     (6%)
     (3%)
     (3%)
     (4%)
     (2%)
    Celkem 171 hlasů
     Komentářů: 12, poslední 10.9. 13:00
    Rozcestník

    Dotaz: CURL a kodování

    24.5.2010 12:02 Rendijer
    CURL a kodování
    Přečteno: 1326×
    Ahoj, někdy před týdnem jsem založil diskusi o automatickém stahování dat přes curl, bohůže ji nemůžu najít a nalinkovat, asi se nedokážu stotožnit s tímhle forem :D

    Mno tak k věci

    Přes Curl stáhnu Log, kde jsou zaznamenány přistupy uživatelů s diakritikou, jenže když ten soubor otevřu, tak diakritika je v sypaném čaji. Jde to přimo udělat parametrem curlu, nebo to musím něčím "upravit"?

    díky

    Řešení dotazu:


    Odpovědi

    24.5.2010 12:12 Gaudentius
    Rozbalit Rozbalit vše Re: CURL a kodování

    Ahoj, nevím - nejsem si jistej, že to u CURLU nastavit lze, nic m=ně si můžeš výstup překódovat: 

    <?php
    // cashuje prohlizec, tak bacha...
    // header("Content-Type: text/html; charset=UTF-8");
    $f  = file_get_contents('mcast.sql');

    // zjisteni kodovani
    function detect($s)
    {
    if (preg_match('#[\x80-\x{1FF}\x{2000}-\x{3FFF}]#u', $s))
    return 'UTF-8';

    if (preg_match('#[\x7F-\x9F\xBC]#', $s))
    return 'WINDOWS-1250';

    return 'ISO-8859-2';
    }

    // automaticky prevod do UTF-8
    function autoUTF($s)
    {
    // detect UTF-8
    if (preg_match('#[\x80-\x{1FF}\x{2000}-\x{3FFF}]#u', $s))
    return $s;

    // detect WINDOWS-1250
    if (preg_match('#[\x7F-\x9F\xBC]#', $s))
    return iconv('WINDOWS-1250', 'UTF-8', $s);

    // assume ISO-8859-2
    return iconv('ISO-8859-2', 'UTF-8', $s);
    }


    print detect($f)."<br/>".autoUTF($f);

    Autorem je Vrána

    24.5.2010 12:20 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Na serveru mi neběží php ...
    24.5.2010 12:27 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    ale co mi běží je iconv.

    Problém je ten, že nevím, v jakém kodovani ten soubor je. Přitom stránka, ze které curl stahuje je utf-8, stáhne a diakritika v souboru je fuč.
    24.5.2010 12:36 Gaudentius
    Rozbalit Rozbalit vše Re: CURL a kodování
    počkej, tak to se bavíme asi oba o něčem jiném - já mluvím o curl v php. iconv je i v jiném programovacím jazyce? nebo jako používáš ten iconv ty?
    24.5.2010 12:46 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Linux samozřejmně
    24.5.2010 13:05 misch | skóre: 3
    Rozbalit Rozbalit vše Re: CURL a kodování
    Rendijer chtěl pravděpodobně říct, že z příkazového řádku volá "curl URL ...", jen na to nějak zapoměl.

    Když ale Rendijer sdělí světu co přesně tedy vlastně používá a s jakými přepínači to volá, možná mu někdo pomůže ...
    24.5.2010 13:14 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Pardon mno, já jsem nemohl najít ten předcházející příspěvek

    Tohle je demostránka výrobce čteček, ze které stahuji data. Tady jsou uživatelé fiktivní a nemají diakritiku. Všechno se stáhne, super. ALe když to chci aplikovat už na reálnou čtečku, kde jsou lidi v logu zobrazeni s diakritikou, tak narazím na problém...

    curl -c curlcookies.txt -d "loginName=A999&loginPass=1&loginLevel=B&command=1" http://74.219.212.106/cgi-bin/login.cgi

    curl -b curlcookies.txt 'http://74.219.212.106/cgi-bin/report.cgi?command=0&elemployeename=&elemployeeid=&elperiod=2&dayFrom=0&dayTo=0&elemployeedept=-999&eltrigger=-1&format=1' > data.csv

    zkoušel jsem pak v data převést kodovaní, ale nešlo to

    iconv -f ISOblabla -t UTF-8 data.csv > ddata.csv

    24.5.2010 15:31 chrono
    Rozbalit Rozbalit vše Re: CURL a kodování
    A si si istý, že ten súbor otváraš/zobrazuješ v utf-8 kódovaní? (pretože nevidím dôvod, prečo by mal curl niečo s tým kódovaním robiť)
    24.5.2010 15:39 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    Zmiňovaný problém, jsme řešily zde, fčul 3. stránka „Starší dotazy“ :).
    Co mám ještě staženo odpovídalo by to kódování utf-8, bo přihlásit se mi na to demo fčulnedaří.
    Přiložte (jako přílohu) sem stažený data.csv nebo jeho část, ale ořezanou tak aby nedošlo ke změně sem položeného obsahu, myslím si, že se na ta data jen „špatně“ díváte.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    24.5.2010 15:52 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Příloha:
    Právě že už při tomhle:

    #curl -c curlcookies.txt -d "loginName=A999&loginPass=1&loginLevel=B&command=1" http://74.219.212.106/cgi-bin/login.cgi

    #curl -b curlcookies.txt 'http://74.219.212.106/cgi-bin/report.cgi?command=0&elemployeename=&elemployeeid=&elperiod=2&dayFrom=0&dayTo=0&elemployeedept=-999&eltrigger=-1&format=1'

    , když to nechám normálně v stdout a nevypíšu to do souboru, tak už tam to zobrazuje tu diaktritiku divně.
    24.5.2010 16:00 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    Jak říkám, data jsou normálně v utf-8, v čem je otvíráte? – TO zlobí
    .
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    24.5.2010 17:14 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Ale nezáleží v čem je otvírám, pokud na stdoud se zobrazí špatně, tak dál sněma ani nemůžu pracovat... Ty data si pak potřebuju upravit a následně snima pracuje účetní program...
    24.5.2010 17:15 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Vám se snad zobrazí diakritika? Otvírám je normálně v Excelu
    24.5.2010 17:38 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    Jasně, vidim hacky/carky :)

    Excel 2003:
    • Přejmenujte si koncovku na txt
    • V Excelu si dejte otevřít a zvolte Všechny soubory *.* a vyberte soubor VasSoubor.txt
    • Zvolte kódování UTF-8 a „Oddělovač“ a tl. Další
    • Oddělovač zvolte JEN čárka a textový kvalifikátor "
    • A pak již třeba dokončit
    OpenOffice 3.x:
    • Zvolte otevřít a vyberte soubor csv
    • Nastavte znakovou sadu Unicode UTF-8, odělovač jen čárka, oddělovač textu "
    • A pak již třeba OK
    VIM:
    • Otevřete soubor
    • zapište: :set encoding=utf-8
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    24.5.2010 18:07 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    Hmhm, děkujů pěkně.. A dá se to nějakým způsobem zautomatizovat? Do přikazového řádku? Nechce mi to nějak fungovat
    24.5.2010 19:12 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    Co nefunguje, popsaný postup, nebo automatizace ?

    Pokud si jste jistý, že ty znaky pokryje windows-1250 (to jest maximálně ö,ä :)), tak to přešupačte pomocí iconv do windows-1250 při exportu.
    iconv -f UTF-8 -t WINDOWS-1250 -o in.csv out.csv
    pak již může účetní klikat.
    Anebo (asi lepší)
    Doplňte 'byte-order marker'
    Před tím než do souboru vysypete ten výstup nasypte tam dva znaky
    echo -ne "\0273\0376" > muj.csv
    a data z curl přídávejte:
    curl -c ... page.cgi >> muj.csv
    Nebo případně po exportu upravte příkazem:
    vim -e -s -c ':set bomb' -c ':wq' muj.csv

    …už to excel žere ?
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    24.5.2010 19:41 Rendijer
    Rozbalit Rozbalit vše Re: CURL a kodování
    díky pane, už to fičí :)
    24.5.2010 17:44 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    Ne-ne, ne :),
    stdout je sype jak to je (o žádném kódování nic neví), a záleží na vašem kódování terminálu a terminálu obecně co vidíte.

    CSV soubor neobsahuj informace o znakové sadě, tudíž je třeba aplikaci explicitně říct explicitně říct jaká to je, že excel je pako a myslí si, že to je poblázněná 1250-ka, je smůla, použijte lepší software, nebo postup viz níže :):):).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    24.5.2010 17:46 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: CURL a kodování
    …viz výše :):):).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    pavlix avatar 24.5.2010 22:56 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: CURL a kodování
    Rendijer chtěl pravděpodobně říct, že z příkazového řádku volá "curl URL ...", jen na to nějak zapoměl.
    Já jsem ho pochopil správně, o PHP nic nepsal.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.