abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:55 | IT novinky

    Digg (Wikipedie), "místo, kde můžete sdílet a objevovat to nejlepší z internetu – a nejen to", je zpět. Ve veřejné betě.

    Ladislav Hagara | Komentářů: 3
    dnes 01:44 | Komunita

    Po .deb balíčcích Mozilla nově poskytuje také .rpm balíčky Firefoxu Nightly.

    Ladislav Hagara | Komentářů: 4
    dnes 00:33 | IT novinky

    Vývojové prostředí IntelliJ IDEA slaví 25. narozeniny (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 23:55 | IT novinky

    Vedení společnosti NVIDIA údajně povolilo použití milionů knih ze známého 'warez' archivu Anna's Archive k výcviku umělé inteligence, ačkoliv vědělo, že archiv tyto knihy nezískal legální cestou. Žaloba, ve které se objevují i citace interních dokumentů společnosti NVIDIA, tvrdí, že NVIDIA přímo kontaktovala Anna's Archive a požadovala vysokorychlostní přístup k datům knihovny.

    NUKE GAZA! 🎆 | Komentářů: 6
    včera 14:33 | Zajímavý software

    Grafický správce balíčků Myrlyn pro SUSE a openSUSE, původně YQPkg, dospěl do stabilní verze 1.0.0. Postaven je nad libzypp a Qt 6. Projekt začal na SUSE Hack Weeku 24.

    Ladislav Hagara | Komentářů: 8
    včera 13:44 | Zajímavý projekt

    Vývojáři se podařilo vytvořit patch pro Wine, díky kterému je možné na linuxovém stroji nainstalovat a spustit Adobe Photoshop (testováno s verzemi Photoshopu PS2021 a PS2025). Dalším patchem se podařilo umožnit dokonce instalaci téměř celého Adobe Creative Cloud Collection 2023, vyjma aplikací Adobe XD a Adobe Fresco. Patch řeší kompatibilitu s windowsovými subsystémy MSHTML - jádrem prohlížeče Internet exporer, a MSXML3 - parserem

    … více »
    NUKE GAZA! 🎆 | Komentářů: 5
    včera 13:33 | IT novinky

    Hackeři zaútočili na portál veřejných zakázek a vyřadili ho z provozu. Systém, ve kterém musí být ze zákona sdíleny informace o veřejných zakázkách, se ministerstvo pro místní rozvoj (MMR) nyní pokouší co nejdříve zprovoznit. Úřad o tom informoval na svém webu a na sociálních sítích. Portál slouží pro sdílení informací mezi zadavateli a dodavateli veřejných zakázek.

    Ladislav Hagara | Komentářů: 11
    včera 12:22 | Nová verze

    Javascriptová knihovna jQuery (Wikipedie) oslavila 20. narozeniny, John Resig ji představil v lednu 2006 na newyorském BarCampu. Při této příležitosti byla vydána nová major verze 4.0.0.

    Ladislav Hagara | Komentářů: 2
    včera 01:33 | Zajímavý projekt

    Singularity je rootkit ve formě jaderného modulu (Linux Kernel Module), s otevřeným zdrojovým kódem dostupným pod licencí MIT. Tento rootkit je určený pro moderní linuxová jádra 6.x a poskytuje své 'komplexní skryté funkce' prostřednictvím hookingu systémových volání pomocí ftrace. Pro nadšence je k dispozici podrobnější popis rootkitu na blogu autora, případně v článku na LWN.net. Projekt je zamýšlen jako pomůcka pro bezpečnostní experty a výzkumníky, takže instalujte pouze na vlastní nebezpečí a raději pouze do vlastních strojů 😉.

    NUKE GAZA! 🎆 | Komentářů: 0
    18.1. 21:22 | Zajímavý projekt

    Iconify je seznam a galerie kolekcí vektorových open-source ikon, ke stažení je přes 275000 ikon z více jak dvou set sad. Tento rovněž open-source projekt dává vývojářům k dispozici i API pro snadnou integraci svobodných ikon do jejich projektů.

    NUKE GAZA! 🎆 | Komentářů: 3
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (5%)
     (0%)
     (9%)
     (20%)
     (3%)
     (5%)
     (2%)
     (11%)
     (38%)
    Celkem 536 hlasů
     Komentářů: 16, poslední dnes 17:04
    Rozcestník

    Dotaz: Jak na ochranu webu?

    22.3.2011 15:35 Michal
    Jak na ochranu webu?
    Přečteno: 346×
    Zdravím,

    chtěl bych se zeptat jak lze chránit server před hromadným stažením dat (máme cca 200 tisíc artiklů)? Něco na způsob sorry.google.com, kdy po necelých tisíci dotazech server vyhodí hlášku sorry a ban na několik hodin, a to dokonce i když to zkusím přes proxy a pak ji změním a nejde to dál (nechápu, ale moc se mi to líbí ;-)).

    Ať studuju jak studuju nikde jsem nic podobného nenašel.

    Díky za jakoukoliv radu.

    Michal

    Odpovědi

    Jendа avatar 22.3.2011 15:44 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Poznamenávej si IP (resp. spíš tak /48 subnety) návštěvníků a počty jejich požadavků a když se ti bude zdát, že je toho moc, tak je prostě uřízni. Řešil bych to asi na aplikační úrovni, tj. ne modulem do webserveru (pokud už tedy něco takového neexistuje).
    22.3.2011 15:51 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    To by bylo nutné buď nastavit limity moc vysoko (celá ochrana by pak byla k ničemu), jinak odříznete velké sítě za proxy nebo NATem – vysoké školy, velké firmy, klienty mobilních operátorů…

    Pokud to Google hlásí i při změně proxy serveru, je to řešené nejspíš přes cookies. To je ochrana spíš před neznalými uživateli – ale ochránit to před znalým uživatelem prakticky nejde.
    23.3.2011 09:59 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Google spíš ignoruje to co jste napsal o odříznutých sítích za proxy či NAT :)
    23.3.2011 10:31 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Tu domněnku máte něčím podloženou?
    23.3.2011 10:44 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Jen nepřímým pozorováním, občas mě ustřihne i když nic masivně nestahuji. Takže podle toho to asi nejsou ani cookies jak se domníváte vy, ani IP, ale něco jiného, co postihuje i nevinné uživatele.
    22.3.2011 15:47 Sten
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Přes proxy to jde, musí být anonymní a musíte si smazat cookies ;-)

    Jednoduše počítají počet přístupů podle IP adresy (buď přímo klienta nebo z X-Proxied-For) za určité časové období. Případně to spojují podle nějakých větších rozsahů (třeba pro IPv6).

    Pokud bych vám chtěl vystahovat web, tak s tím nic nenaděláte (při 200 000 stránkách je to jedna stránka za 3 sekundy a za týden to mám stažené) :-) Ta googlí ochrana není kvůli vystahování, ale ochrana proti DoS a DDoS útokům (limituje počet požadavků za časové období).
    23.3.2011 09:28 Michal
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Právě že Google to řeší asi nějak jinak, nevím. Protože jsem to zkoušel wgetem s hlavičkou Mozilly, samozřejmě s vypnutými cookies a různými proxy. Což mě právě překvapilo, že i tak to stále nešlo. Evidentně proxy, ať už transparentní nebo anonymní, někde něco o daném klientovi asi zasílá, jinak si to nedovedu vysvětlit. Každopádně mi to pak nešlo ani z mé IP napřímo, takže... ;-).

    Ale četl jsem někde, že google to má udělané tak, že po xtém dotazu vyhodí captchu a pokud neodpovím, tak to zabanuje. Což mi přijde taky zajímavý nápad.

    Zatím jsem zkusil nastavit fail2ban a omezení v iptables na jednu IP.

    Michal
    23.3.2011 09:51 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Normální proxy server může dál posílat IP adresu nebo jinou identifikaci klienta. Ale anonymní proxy by to dělat neměla, od toho je anonymní (správně česky by tedy spíš mělo být anonymizující)… Hlavička User-Agent prý identifikuje klienta docela přesně, ale pochybuju, že Google tuhle metodu používá pro omezení přístupu, přeci jen by tam bylo příliš mnoho falešných reakcí. Každopádně pokud to chcete zkoumat, nemá smysl to hádat, prostě si tu komunikaci pomocí Tcpdumpu nebo Wiresharku zachyťte a prohlédněte.
    23.3.2011 12:31 Sten
    Rozbalit Rozbalit vše Re: Jak na ochranu webu?
    Anonymní proxy nezasílá, kdo si stažení objednal, proto je anonymní. Na druhou stranu anonymní proxy už může vyžadovat captchu, protože ji mohly používat (a pokud to není vaše a s autorizací, tak velmi pravděpodobně používaly) nějací roboti.

    Transparentní a „obyčejná“ proxy posílají hlavičku „X-Forwarded-For“, kde je IP adresa toho, kdo si stažení objednal; Google pak počítá jeden hit pro IP adresu z té hlavičky a další pro IP adresu té proxy.

    Google to má udělané tak, že pokud máte příliš mnoho dotazů za určité časové období, vyhodí captchu a během toho časového období vám nedovolí další hledání, dokud na tu captchu neodpovíte (a že jste odpověděli se IMO uloží do cookies, takže to platí jenom vám a ne ostatním, co mají stejnou IP adresu).

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.