abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:33 | IT novinky

    Americký prezident Donald Trump vyzval nového generálního ředitele firmy na výrobu čipů Intel, aby odstoupil. Prezident to zdůvodnil vazbami nového šéfa Lip-Bu Tana na čínské firmy.

    Ladislav Hagara | Komentářů: 6
    včera 16:55 | Nová verze

    Bylo vydáno Ubuntu 24.04.3 LTS, tj. třetí opravné vydání Ubuntu 24.04 LTS s kódovým názvem Noble Numbat. Přehled novinek a oprav na Discourse.

    Ladislav Hagara | Komentářů: 0
    včera 16:44 | Nová verze

    Byla vydána verze 1.89.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | IT novinky

    Americká technologická společnost Apple uskuteční v USA další investice ve výši sta miliard dolarů (2,1 bilionu korun). Oznámil to ve středu šéf firmy Tim Cook při setkání v Bílém domě s americkým prezidentem Donaldem Trumpem. Trump zároveň oznámil záměr zavést stoprocentní clo na polovodiče z dovozu.

    Ladislav Hagara | Komentářů: 3
    včera 04:55 | Nová verze

    Zálohovací server Proxmox Backup Server byl vydán v nové stabilní verzi 4.0. Založen je na Debianu 13 Trixie.

    Ladislav Hagara | Komentářů: 0
    6.8. 16:33 | Nová verze

    Byla vydána nová verze 1.54.0 sady nástrojů pro správu síťových připojení NetworkManager. Novinkám se v příspěvku na blogu NetworkManageru věnuje Jan Václav.

    Ladislav Hagara | Komentářů: 0
    6.8. 14:11 | IT novinky

    Knižní edice správce české národní domény přináší novou knihu zkušeného programátora Pavla Tišnovského s názvem Programovací jazyk Go. Publikace nabízí srozumitelný a prakticky zaměřený pohled na programování v tomto moderním jazyce. Nejedná se však o klasickou učebnici, ale spíše o průvodce pro vývojáře, kteří s Go začínají, nebo pro ty, kdo hledají odpovědi na konkrétní otázky či inspiraci k dalšímu objevování. Tištěná i digitální verze knihy je již nyní k dispozici u většiny knihkupců.

    Ladislav Hagara | Komentářů: 2
    6.8. 13:11 | IT novinky

    OpenAI zpřístupnila (en) nové nenáročné otevřené jazykové modely gpt-oss (gpt-oss-120b a gpt-oss-20b). Přístupné jsou pod licencí Apache 2.0.

    Ladislav Hagara | Komentářů: 5
    6.8. 04:33 | Nová verze

    Byla vydána RC verze openSUSE Leap 16. S novým instalátorem Agama, Xfce nad Waylandem a SELinuxem.

    Ladislav Hagara | Komentářů: 0
    6.8. 03:44 | Nová verze

    Google Chrome 139 byl prohlášen za stabilní. Nejnovější stabilní verze 139.0.7258.66 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 12 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře. S verzí 139 přestal být podporován Android 8.0 (Oreo) a Android 9.0 (Pie).

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (41%)
     (23%)
     (4%)
     (6%)
     (3%)
     (1%)
     (1%)
     (20%)
    Celkem 277 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: Stiahnutie webu a prevod na CSV súbor.

    13.12.2010 10:45 macros
    Stiahnutie webu a prevod na CSV súbor.
    Přečteno: 317×
    Potreboval by som z adresy http://obaly.sazp.sk/regosob.php?action=edit&id=507 vytiahnuť dáta a vložiť ich do samostatného súboru. A toto urobiť pre id 1 až 10000. Pričom konečným výstupom by mal byť jeden najlepšie CSV súbor.

    Je mi jasné, že pomocou nejakého skriptu by to šlo. Žiaľ s mojimi znalosťami je to nad moje sily a preto by som Vás chcel poprosiť buď o radu, alebo o návrh riešenia. Mne sa zatiaľ podarilo len to, že lynx mi spraví dump stranky a zobrazí údaje:
    [majo@mitgard ~]$  lynx --dump "http://obaly.sazp.sk/regosob.php?action=edit&id=507" -assume_charset:iso8859-2 
         [1]Prihlásenie   [rozdelovnik.gif]   Register osôb
    
                           Dnes je 13.12.2010   [rozdelovnik.gif]    [2]tlacit
    
    
    
         [3]Register osôb [rozdelovnik_nadpis.gif] COLOR company, s.r.o.,
       36307262
    
         Základná Údaje:
         Názov firmy: COLOR company, s.r.o.
         ICO: 36307262
         Registracné císlo: PO_0000261
         Druh firmy: Právnicka osoba
         Stav firmy: Registrované
         Dátum registrácie: 12.02.2004
         Dátum prijatia: 12.02.2004
         Adresa:
         Ulica: Stúrova
         Císlo: 1504
         PSC: 01841
         Obec: Dubnica nad Váhom
         Telefón: 042/4428989
         Fax: 042/4428989
         Email: [4]color@colorcompany.sk
         Stránka www: [5]www.colorcompany.sk
         Statutár:
         Meno a priezvisko: Dusan Bucek, Ing.
         Ulica: Pod Hájom
         Císlo: 1099/101
         PSC: 01841
         Obec: Dubnica nad Váhom
         Registrované materiály:
         Plasty, Kovy - Ocel
    
    References
    
       1. http://obaly.sazp.sk/index.php
       2. http://obaly.sazp.sk/regosob.php?action=edit&id=507
       3. http://obaly.sazp.sk/regosob.php?action=list
       4. mailto:color@colorcompany.sk
       5. http://www.colorcompany.sk/
    
    
    Z tohto by som potreboval vybrať len meniace sa hodnoty za spoločnosť, oddeliť ich čiarkou a takto uložiť do súboru. Pričom by sa tam mohlo uložiť aj číslo ID, alebo link ktory je napr. Referencia č. 2. Viem že by to mohlo ísť trebárs cez grep, ale sám neviem ako...

    Ďakujem Vám za Vaše rady.

    Odpovědi

    13.12.2010 12:39 NN
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Myslim, ze curl,wget + perl/sed regex to hrave zvladnou..

    NN
    13.12.2010 13:53 macros
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Ano, to si myslim aj ja. Ale skor by som potreboval nieco viac ako len ze to ide... ;)
    13.12.2010 15:48 Buri
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    No viac je len navrh spominane nastudovat, zacnite Regular Expressions vyborny tutorial: http://www.regular-expressions.info/tutorial.html

    Ostatne sa vyvrbi.

    Alebo zalozte projekt a budget a nechajte si to napisat.
    13.12.2010 17:22 macros
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Dakujem za ten link. Skusim si to nastudovat. Netusim kolko by mohlo stat nechat si napisat skript, ktory bude mat tak mozno do 20 riadkov... Ale snad sa mi to podari aj samemu. A ak nie, nic ine mi neostane :)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.