abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    včera 15:22 | IT novinky

    Probíhá Meta Connect 2023. Společnost Meta představuje své novinky v oblasti AI a virtuální, smíšené a rozšířené reality. Představeny byly nové chytré brýle Ray-Ban | Meta a headset Meta Quest 3.

    Ladislav Hagara | Komentářů: 0
    včera 12:00 | IT novinky

    Eben Upton oficiálně představil (YouTube) nové Raspberry Pi 5 (YouTube). Je více než 2x výkonnější než jeho předchůdce, model 4B.

    Ladislav Hagara | Komentářů: 6
    včera 08:00 | Nová verze

    Byl vydán (YouTube) Counter-Strike 2. Nativně také pro Linux. Jedná se o největší technologický skok v historii této populární herní série.

    Ladislav Hagara | Komentářů: 6
    včera 07:00 | Komunita

    Richard Stallman vystoupí v Praze s přednáškou Free Software And Your Freedom. V sobotu 30. září ve 14:30 na Pedagogické fakultě UK a v neděli 1. října v 18:00 hodin v rámci konference Hackers Congress Paralelní Polis.

    Jendа | Komentářů: 7
    27.9. 14:44 | Nová verze

    Byla vydána verze 6 s kódovým název Faye linuxové distribuce LMDE (Linux Mint Debian Edition). Podrobnosti v poznámkách k vydání. Linux Mint vychází z Ubuntu. LMDE je postaveno na Debianu.

    Ladislav Hagara | Komentářů: 2
    27.9. 13:11 | Bezpečnostní upozornění

    Byly publikovány informace o novém bezpečnostním problému pojmenovaném GPU.zip (paper, GitHub). S vlastním logem. Jedná se o možný útok postranním kanálem na grafickou kartu (GPU). Proces může "krást pixely" jinému procesu.

    Ladislav Hagara | Komentářů: 1
    27.9. 08:00 | Komunita

    Projekt GNU dnes slaví 40. výročí. Přesně před čtyřiceti lety, 27. září 1983, Richard Stallman oznámil, že se chystá napsat s Unixem kompatibilní operační systém GNU (Gnu's Not Unix). Hlavní oslava a setkání hackerů probíhá ve Švýcarsku ve městě Biel/Bienne. Na programu je také přednáška Richarda Stallmana.

    Ladislav Hagara | Komentářů: 11
    26.9. 15:55 | Nová verze

    Byl vydán Mozilla Firefox 118.0. Přehled novinek v poznámkách k vydání, poznámkách k vydání pro firmy a na stránce věnované vývojářům. Vypíchnout je nutno automatický lokální strojový překlad webových stránek. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 118 je již k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 41
    26.9. 12:55 | Nová verze

    Byla vydána nová major verze 15.0.0 softwaru OCRmyPDF pro přidávání textové vrstvy k naskenovaným PDF dokumentům (PDF/A). Přehled novinek v poznámkách k vydání. OCRmyPDF využívá pro optické rozpoznávání znaků (OCR) engine Tesseract.

    Ladislav Hagara | Komentářů: 22
    26.9. 12:22 | Zajímavý software

    Karel Matějka zveřejnil druhé demo své chystané hry Bzzzt. Kromě verze pro Windows a macOS je dostupná i verze pro Linux. Plná verze hry má vyjít zanedlouho.

    Ondřej J | Komentářů: 8
    Knihy s linuxovou tematikou
     (19%)
     (15%)
     (51%)
     (27%)
    Celkem 279 hlasů
     Komentářů: 11, poslední 17.9. 19:19
    Rozcestník

    Dotaz: Stiahnutie webu a prevod na CSV súbor.

    13.12.2010 10:45 macros
    Stiahnutie webu a prevod na CSV súbor.
    Přečteno: 277×
    Potreboval by som z adresy http://obaly.sazp.sk/regosob.php?action=edit&id=507 vytiahnuť dáta a vložiť ich do samostatného súboru. A toto urobiť pre id 1 až 10000. Pričom konečným výstupom by mal byť jeden najlepšie CSV súbor.

    Je mi jasné, že pomocou nejakého skriptu by to šlo. Žiaľ s mojimi znalosťami je to nad moje sily a preto by som Vás chcel poprosiť buď o radu, alebo o návrh riešenia. Mne sa zatiaľ podarilo len to, že lynx mi spraví dump stranky a zobrazí údaje:
    [majo@mitgard ~]$  lynx --dump "http://obaly.sazp.sk/regosob.php?action=edit&id=507" -assume_charset:iso8859-2 
         [1]Prihlásenie   [rozdelovnik.gif]   Register osôb
    
                           Dnes je 13.12.2010   [rozdelovnik.gif]    [2]tlacit
    
    
    
         [3]Register osôb [rozdelovnik_nadpis.gif] COLOR company, s.r.o.,
       36307262
    
         Základná Údaje:
         Názov firmy: COLOR company, s.r.o.
         ICO: 36307262
         Registracné císlo: PO_0000261
         Druh firmy: Právnicka osoba
         Stav firmy: Registrované
         Dátum registrácie: 12.02.2004
         Dátum prijatia: 12.02.2004
         Adresa:
         Ulica: Stúrova
         Císlo: 1504
         PSC: 01841
         Obec: Dubnica nad Váhom
         Telefón: 042/4428989
         Fax: 042/4428989
         Email: [4]color@colorcompany.sk
         Stránka www: [5]www.colorcompany.sk
         Statutár:
         Meno a priezvisko: Dusan Bucek, Ing.
         Ulica: Pod Hájom
         Císlo: 1099/101
         PSC: 01841
         Obec: Dubnica nad Váhom
         Registrované materiály:
         Plasty, Kovy - Ocel
    
    References
    
       1. http://obaly.sazp.sk/index.php
       2. http://obaly.sazp.sk/regosob.php?action=edit&id=507
       3. http://obaly.sazp.sk/regosob.php?action=list
       4. mailto:color@colorcompany.sk
       5. http://www.colorcompany.sk/
    
    
    Z tohto by som potreboval vybrať len meniace sa hodnoty za spoločnosť, oddeliť ich čiarkou a takto uložiť do súboru. Pričom by sa tam mohlo uložiť aj číslo ID, alebo link ktory je napr. Referencia č. 2. Viem že by to mohlo ísť trebárs cez grep, ale sám neviem ako...

    Ďakujem Vám za Vaše rady.

    Odpovědi

    13.12.2010 12:39 NN
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Myslim, ze curl,wget + perl/sed regex to hrave zvladnou..

    NN
    13.12.2010 13:53 macros
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Ano, to si myslim aj ja. Ale skor by som potreboval nieco viac ako len ze to ide... ;)
    13.12.2010 15:48 Buri
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    No viac je len navrh spominane nastudovat, zacnite Regular Expressions vyborny tutorial: http://www.regular-expressions.info/tutorial.html

    Ostatne sa vyvrbi.

    Alebo zalozte projekt a budget a nechajte si to napisat.
    13.12.2010 17:22 macros
    Rozbalit Rozbalit vše Re: Stiahnutie webu a prevod na CSV súbor.
    Dakujem za ten link. Skusim si to nastudovat. Netusim kolko by mohlo stat nechat si napisat skript, ktory bude mat tak mozno do 20 riadkov... Ale snad sa mi to podari aj samemu. A ak nie, nic ine mi neostane :)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.