abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:00 | Nová verze

    Lazygit byl vydán ve verzi 0.62.0. Jedná se o TUI (Text User Interface) nadstavbu nad gitem.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | Zajímavý článek

    Jiří Eischmann se v příspěvku na svém blogu o rozepsal o tom, kam se vyhledávání v jeho očích posledních 10 let posunulo, jaké má zkušenosti s AI vyhledáváním, proč na něm nechce záviset a jaké vyhledávací služby ho v poslední době zaujaly.

    Ladislav Hagara | Komentářů: 0
    dnes 03:33 | Nová verze

    Wayland kompozitor Labwc byl vydán ve verzi 0.20.0. Labwc je inspirován správcem oken Openbox. Postavený je na wlroots.

    Ladislav Hagara | Komentářů: 0
    včera 17:00 | Nová verze

    AlmaLinux OS byl vydán ve verzích 9.8 s kódovým jménem Olive Jaguar a 10.2 s kódovým jménem Lavender Lion. Podrobnosti v poznámkách k vydání (9.8 a 10.2). Opraveny byly zranitelnosti Copy Fail (CVE-2026-31431), Dirty FRAG, Fragnesia (CVE-2026-46300), nginx Rift (CVE-2026-42945) a SSH Keysign Pwn (CVE-2026-46333).

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | IT novinky

    Seznam.cz vykázal za rok 2025 tržby v celkové hodnotě 6,454 miliardy korun. Oproti roku 2024 nárůst o 3,68 %. Zisk před zdaněním oproti předcházejícímu roku poklesl, a to o 11,21 % na 1,330 miliardy korun. Vlastní velké jazykové modely SeLLMa najdou dnes uživatelé téměř na všech seznamáckých službách. Na všechny obsahové služby byla zavedena technologie text-to-speech, díky níž si mohou uživatelé přehrát články v audio verzi namluvené

    … více »
    Ladislav Hagara | Komentářů: 1
    včera 13:22 | IT novinky

    Vláda představila strategické digitalizační projekty. Roadmapa zahrnuje celkem 55 projektů napříč státní správou, z toho 22 prioritních projektů vycházejících přímo z programového prohlášení vlády a 33 projektů založených na platné legislativě. Portfolio pokrývá oblasti financí, zdravotnictví, digitální identity, dat, registrů, dopravy, krizového řízení, sociálních agend i kybernetické bezpečnosti.

    Ladislav Hagara | Komentářů: 0
    včera 00:22 | Komunita

    Vyjádřeni Software Freedom Conservancy (SFC) k porušování licence AGPLv3 společností Bambu Lab v jejich softwaru Bambu Studio pro 3D tisk. Bambu Studio vychází z PrusaSliceru. Ten zase z Slic3ru. Spuštěn byl projekt baltobu, který kombinuje několik strategií pro řešení problému. SFC zastřeší vývoj svobodné náhrady proprietární knihovny libbambu_networking pomocí reverzního inženýrství a reimplementace, forku OrcaSliceru pro Bambu Lab tiskárny od Paweła Jarczaka a forku celého Bambu Studia pod názvem Viscose.

    Ladislav Hagara | Komentářů: 3
    25.5. 22:44 | Nová verze

    Správce souborů GNOME Commander (Wikipedie) byl přepsán do Rustu a vydán v nové verzi 2.0.0.

    Ladislav Hagara | Komentářů: 1
    25.5. 19:44 | Nová verze

    Sway (Wikipedie), dlaždicový (tiling) správce oken pro Wayland kompatibilní s i3, byl vydán ve verzi 1.12. Do vývoje se zapojilo 50 vývojářů. Přehled novinek na GitHubu. Sway 1.12 závisí na wlroots 0.20.0.

    Ladislav Hagara | Komentářů: 0
    25.5. 16:33 | IT novinky

    Papež Lev XIV. ve své první encyklice Magnifica Humanitas (Skvělé lidství), která se věnuje umělé inteligenci (AI), varoval před dezinformacemi, které AI manipulací s obsahem vytváří. Moc mají podle něj sociální sítě ovládané hrstkou soukromníků. Upozornil také roli digitálních platforem v obchodování s lidmi, které podle něj musí být uznáno jako současná forma otroctví. Papež se také poprvé omluvil za roli, kterou Vatikán sehrál při legitimizaci otroctví, a za to, že jej po staletí neodsoudil.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (14%)
     (31%)
     (4%)
     (7%)
     (3%)
     (16%)
     (26%)
    Celkem 1723 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: Jak uložit data z jiný stránky do databáze

    18.3.2011 21:41 beginer666 | skóre: 9
    Jak uložit data z jiný stránky do databáze
    Přečteno: 599×
    Ahoj, chtěl jsem se s Váma poradit jak uložit data z jiný stránky do databáze.

    Potřeboval bych uložit ty data abych je později přiřadil k hráčům.

    Rád bych to načítal z http://eu.leagueoflegends.com/ladders/solo-5x5 ale netuším jak by to šlo. Je tam totiž víc stránek etc. etc. docela pro mě problém, možná ale bude někdo vědět.

    Jde mi o to abych stáhnul hlavně nick a raiting ze všech stránek(cca 3500) co tam jsou.

    Takže aby byl výledek

    např.:
    -----------------------------
    ||Nick || Raiting || Pořadí||
    -----------------------------
    ||sOAZ || 2206    || 2     ||
    -----------------------------
    etc.
    
    Díky moc za nápady.


    Řešení dotazu:


    Odpovědi

    18.3.2011 21:45 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Funkční odkaz je Zdrojová stránka
    19.3.2011 00:31 smartin | skóre: 1
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Za prve napis v jakem jazyce a databazi :)

    Za druhe pouzij regularni vyrazy a mas vyhrano :)
    19.3.2011 09:04 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Je uplně jedno v jakym jazyce, prostě to potřebuju dostat do databáze a dál si stim umim poradit.

    Regulární výrazy neovládám - chápu že se to dá najít na netu , ale to bych u toho strávil mládí - proto jsem rád že existujou takovýhle poradny kde mě vždycky někde hezky nakopne.

    Nepotřebuju hotové řešení jen první kopanec.

    Třeba vůbec nechápu jak bych z bashe kontaktoval ten server. Přes telnet? A co dál?

    19.3.2011 10:08 tuxmartin | skóre: 39 | blog: tuxmartin | Jicin
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Třeba vůbec nechápu jak bych z bashe kontaktoval ten server. Přes telnet? A co dál?
    Co treba curl, nebo wget?
    wget -q -O - http://eu.leagueoflegends.com/ladders/solo-5x5
    
    Tim ziskas stranku, a pak uz jen zpacovani:
    wget -q -O - http://eu.leagueoflegends.com/ladders/solo-5x5 | grep XXXXX
    
    19.3.2011 12:43 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Díky za tip, už jsem mezitím pracoval s curl. Těd už to stačí jenom vygrepovat, awk, cut etc. holt se u toho budu muset trošku vyvztekat.

    Jinak by mě zajímalo co je lepší použít když stim budu načítat cca 11000 stránek. WGET nebo CURL? Myslim co víc zatíží server.

    Díky
    19.3.2011 10:41 l4m4
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Když to shrnu:

    * Je úplně jedno, v jakém jazyce a do jaké databáze.

    * Nepotřebuješ úplné řešení, stačí nakopnutí.

    Mohou tyto věci platit současně, pokud neovládáš všechny existující databáze a všechny existující programovací jazyky? A je v tom případě takové problém naučit se k nim ještě regulární výrazy?
    19.3.2011 15:34 otakar | skóre: 6
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Zkus pohledat, jestli autoři neposkytují soubor se statistikou. Zpracovat jeden soubor je snadné, pokud to budeš tahat po kouskách wgetem, tak ve výsledku (v db) budou zmatky, nepřesnosti atd. + provozovatel servru tě nebude mít rád.
    19.3.2011 16:42 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Bohužel neposkytují. Ta statistika je online a načítá se z jejich databáze. Přístup do databáze mi nedají. ):
    19.3.2011 18:39 otakar | skóre: 6
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Takhle je to u všech her :-)

    Některé herní servry poskytnou jednou za den výpis dat (komprimovaný) a je možné si dělat vlastní statistiky. Zkus se s nimi domluvit. Pokud je cílem historie statistik mohlo by to být výhodné i pro ně.

    Tady je ukázka jednoho servru, jak vypadá rozumný přístup příklad

    Ta adresa v nápovědě není všem na očích, ale kdo hledá - najde.
    19.3.2011 17:07 chrono
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Dá sa použiť napr. Scrapy, ale ako už bolo napísané, je tam príliš veľa stránok, takže tie údaje môžu byť nepresné (pretože počas spracovávania sa môžu tie údaje zmeniť) a je veľmi pravdepodobné, že ich server ťa zablokuje skôr, ako to stihneš prejsť aspoň raz.
    Řešení 1× (beginer666 (tazatel))
    19.3.2011 18:18 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Tak už jsem to vyřešil, sice to trvá skoro hodinu ale průměrná zátěž na ten server je 200 kbit/s což by nemuseli ani zjistit.

    díky za pomoc
    19.3.2011 18:33 tuxmartin | skóre: 39 | blog: tuxmartin | Jicin
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Jestli to delas wgetem, tak se podivej do manualu na parametry:
    --limit-rate=
    --random-wait=
    --user-agent=
    Nasimuluj si tak treba Firefox a nahodne cekani mezi pozadavky => bude jim to min napadne.
    19.3.2011 18:49 otakar | skóre: 6
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    nahodne cekani mezi pozadavky
    Tohle zvětší šanci na změnu dat - posun hráčů mezi stránkami => ve vlastní db budou chyby (nezachycený hráč a zdvojený hráč).
    19.3.2011 18:44 otakar | skóre: 6
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Nejde pouze o trafic. Každý tvůj požadavek musí zpracovat i databáze a (asi) taky php.
    19.3.2011 20:07 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Před chvíli mi to doběhlo - trvalo to přesně 2 hodiny.
    
    | 88488 | 88488    | kanaris                | 2    | 2    | 1200   |
    | 88489 | 88489    | BEDbMAK007             | 2    | 2    | 1200   |
    | 88490 | 88490    | John Darck             | 2    | 2    | 1200   |
    | 88491 | 88491    | 150                    | 2    | 2    | 1200   |
    | 88492 | 88492    | Lemine                 | 2    | 2    | 1200   |
    | 88493 | 88493    | xFirefighterx          | 2    | 2    | 1200   |
    
    
    
    Všecky záznamy se mi načetli maximálně korektně. První sloupek je ID co si vytváří DB a druhé číslo je přímo pořadové šíslo ze stránek. Pro všech 88493 záznamů je to 1:1.

    Přemejšlim jak by se to dalo načíst rychleji. Je to celkem 3650 stránek takže kdybych je načetl po po deseti tak mi na to stačí pouze 360 jobů/scriptů. Teď ještě vymyslet jaký způsobem to rozdělit.

    Pokud má někdo zkušenosti s masivním dotazování rád se poučím.

    Těch 360 jobů zabere 360*200kbit/s takže celkem(72Mbit/s) jsem zvědavej jestli si toho už někdo všimne. ((;
    20.3.2011 00:47 YYY | skóre: 29 | blog: martinek
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Nebylo by lepsi se s provozovatelem ferove dohodnout, nez ho takhle bagrovat? :)
    20.3.2011 10:48 chrono
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Podobné otázky na ich fóre už boli a vždy boli ignorované.
    26.3.2011 22:47 Kit
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Před chvíli mi to doběhlo - trvalo to přesně 2 hodiny.
    Zkusil jsem příkaz
    curl "http://eu.leagueoflegends.com/ladders/solo-5x5?page=[0-3684]"\
        -o "solo#1.html"
    Stahovalo mi to rychlostí cca 1 stránku za sekundu. Tedy za hodinu by to curl měl zvládnout. S paralelizací možná i dříve. Celý výstup se dá snadno přesměrovat do dalšího procesu:
    curl -s "http://eu.leagueoflegends.com/ladders/solo-5x5?page=[0-3684]" |\
         zpracovani | ulozeni-do-databaze
    Řešení 1× (beginer666 (tazatel))
    27.3.2011 15:54 beginer666 | skóre: 9
    Rozbalit Rozbalit vše Re: Jak uložit data z jiný stránky do databáze
    Už jsem to vyřešil v jinym dotazu. Problém byl hlavně v ukládání do DB s každym výsledkem.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.