Eric Lengyel dobrovolně uvolnil jako volné dílo svůj patentovaný algoritmus Slug. Algoritmus vykresluje text a vektorovou grafiku na GPU přímo z dat Bézierových křivek, aniž by využíval texturové mapy obsahující jakékoli předem vypočítané nebo uložené obrázky a počítá přesné pokrytí pro ostré a škálovatelné zobrazení písma, referenční ukázka implementace v HLSL shaderech je na GitHubu. Slug je volným dílem od 17. března letošního
… více »Sashiko (GitHub) je open source automatizovaný systém pro revizi kódu linuxového jádra. Monitoruje veřejné mailing listy a hodnotí navrhované změny pomocí umělé inteligence. Výpočetní zdroje a LLM tokeny poskytuje Google.
Cambalache, tj. RAD (rapid application development) nástroj pro GTK 4 a GTK 3, dospěl po pěti letech vývoje do verze 1.0. Instalovat jej lze i z Flathubu.
KiCad (Wikipedie), sada svobodných softwarových nástrojů pro počítačový návrh elektronických zařízení (EDA), byl vydán v nové major verzi 10.0.0 (𝕏). Přehled novinek v příspěvku na blogu.
Letošní Turingovou cenu (2025 ACM A.M. Turing Award, Nobelova cena informatiky) získali Charles H. Bennett a Gilles Brassard za základní přínosy do oboru kvantové informatiky, které převrátily pojetí bezpečné neprolomitelné komunikace a výpočetní techniky. Jejich protokol BB84 z roku 1984 umožnil fyzikálně zaručený bezpečný přenos šifrovacích klíčů, zatímco jejich práce o kvantové teleportaci položila teoretické základy pro budoucí kvantový internet. Jejich práce spojila fyziku s informatikou a ovlivnila celou generaci vědců.
Firefox 149 dostupný od 24. března přinese bezplatnou vestavěnou VPN s 50 GB přenesených dat měsíčně (s CZ a SK se zatím nepočítá) a zobrazení dvou webových stránek vedle sebe v jednom panelu (split view). Firefox Labs 149 umožní přidat poznámky k panelům (tab notes, videoukázka).
Byla vydána nová stabilní verze 7.9 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 146. Přehled novinek i s náhledy v příspěvku na blogu.
Dle plánu byla vydána Opera GX pro Linux. Ke stažení je .deb i .rpm. V plánu je flatpak. Opera GX je webový prohlížeč zaměřený na hráče počítačových her.
GNUnet (Wikipedie) byl vydán v nové major verzi 0.27.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.
Byly publikovány informace (technické detaily) o bezpečnostním problému Snapu. Jedná se o CVE-2026-3888. Neprivilegovaný lokální uživatel může s využitím snap-confine a systemd-tmpfiles získat práva roota.
Zaujal mě extrémní traffic do zahraničí a pátral jsem po jeho původu.
Za poslední měsíc na můj skromný webík přibyl jenom jeden malý zvukový záznam, který si stáhlo asi 16 lidí. Přesto má přenos do zahraničí v řádu desítek GB, což už pomalu překračuje představy ISP.
Pátral jsem proto, proč má web s materiály v češtině takový traffic do zahraničí (do NIXu máme data skoro zadarmo). Po přechroustání logu krátkým skriptem jsem to zjistil:
::ffff:67.195.115.53 video.hrach.eu - [18/Feb/2011:15:26:16 +0100] "GET /video/scf10/soufflot-access-for-enterprise.ogg HTTP/1.0" 200 63697400 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [18/Feb/2011:18:13:11 +0100] "GET /video/sprava_serveru.webm HTTP/1.0" 200 129259872 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [18/Feb/2011:21:18:45 +0100] "GET /video/scf10/diskuze.webm HTTP/1.0" 200 120367707 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [18/Feb/2011:23:46:32 +0100] "GET /robots.txt HTTP/1.0" 404 345 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [18/Feb/2011:23:52:33 +0100] "GET /video/editory.mkv HTTP/1.0" 200 120202635 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [19/Feb/2011:07:58:56 +0100] "GET /video/scf10/malec-elektronicke-pasy.ogg HTTP/1.0" 200 119739224 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [19/Feb/2011:10:25:38 +0100] "GET /robots.txt HTTP/1.0" 404 345 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.53 video.hrach.eu - [19/Feb/2011:10:31:39 +0100] "GET /video/scf10/klupka-multiplikacni-cipove-karty.ogg HTTP/1.0" 200 128473992 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
Crawler Yahoo opakovaně tahá všechny videozáznamy! Jeho IP se navíc co 14 dní mění, ale vždy je z rozsahu Yahoo. Od 25. července 2010 přenesl neuvěřitelných 164 GB (!!!), což je polovina celkového přenosu.
Ostatní crawlery se vždycky na ten soubor zeptají, a když jim přijde Content-Type: video/mp4 nebo podobná hlavička, tak spojení přeruší a už tam nelezou.
Crawlování adresáře /video jsem zakázal v robots.txt, a pokud to nepomůže, přidám zajímavé pravidlo do firewallu.
Pokud provozujete nějaký stahovací web, mirror linuxové distribuce nebo něco podobného, zvažte bloknutí takovýchto neřádů. Možná, že máte obrovský drahý traffic do zahraničí úplně zbytečně.
Yahoo leze i na mirror ArchLinuxu a tahá balíčky, za posledních 11 dní (déle se tam neloguje) protáhlo 15 giga.
Update: Pokud vám nevadí, že si robot stáhne každý soubor jenom jednou, zkontrolujte si, že posíláte hlavičky Last-Modified a ETag. Například LigHTTPd je totiž neposílá, pokud u souboru nezná mime typ. Viz diskuzi u komentáře #14.
Tiskni
Sdílej:
67.195.111.154 67.195.111.186 67.195.112.43 67.195.112.48 67.195.115.121 67.195.115.53 67.195.115.55 67.195.115.87 67.195.37.187 72.30.142.215
Dival jsem se na Vas osobni web a tak se ptam jak jste spokojen s hostingem od http://www.000webhost.com/
Zda vyuzivate free variantu a nebo jste neco priplatil za sluzby navic.
Kdysi jsem se zminoval v blogu o tomto poskytovateli.
Takže alespoň dodatečně díky za ten zápis 
Ale jak již psala Alexandra Pokorná přede mnou, s rychlostí to není nic moc extra. Jak kdysi napsal jistý člověk, kterému jsem tam uložil jeden soubor: "Chovalo se to, jako by server byl za ADSL a dvěma WiFinami
" (doufám, že tomu dotyčnému zveřejnění této části mailu nevadí...). Výpadky občas bývají, to je pravda, ale nevidím to s nimi nikterak černě.
Ale pokud by jsi věděl (doufám, že tykání nevadí, pokud ano, tak se omlouvám...) o něčem lepším, tak sem s tím! 
A lidi v Yahoo to neštve? Přeci jenom, při představě, kolik dat musí stáhnout prolézá-li celý web...Také mi to přišlo fascinující. Mimochodem, má-li tu někdo nějaký podobný web (balíčky, video, audio) a loguje, kouknul by se, jestli tohle postihlo selektivně vpsFree, nebo je to i jinde? Zkusím se ještě zeptat adminů z mirroru na ČVUT, jestli si něčeho takového také nevšimli.
Co takto napsat někomu přímo do Yahoo, nemělo by to smysl?Jo, dobrý nápad, o něčem porozmýšlím. Jinak podobné problémy očividně mají i tady a tady (co jsem tak rychle vygooglil).
Zkusím se ještě zeptat adminů z mirroru na ČVUT, jestli si něčeho takového také nevšimli.Tak ze Silicon Hill Mirroru také stahuje, a to velmi - kolem 8000 requestů za den. Povšimněte si, prosím, že stahuje, i když jejich server normálně posílá
ETag, Last-Modified i Age.
Překládám ftp.sh.cvut.cz… 147.32.127.222, 2001:718:2::222 Navazuje se spojení s ftp.sh.cvut.cz|147.32.127.222|:80… spojeno. HTTP požadavek odeslán, program čeká na odpověď… HTTP/1.0 200 OK Date: Sat, 19 Feb 2011 08:16:20 GMT Server: Apache/2.2.9 (Debian) PHP/5.2.6-1+lenny9 with Suhosin-Patch Last-Modified: Mon, 22 Nov 2010 11:53:15 GMT ETag: "1033-2bc9b800-495a2e6b980c0" Accept-Ranges: bytes Content-Length: 734640128 Content-Type: application/x-iso9660-image Age: 45834 X-Cache: HIT from ftp.sh.cvut.cz X-Cache-Lookup: HIT from ftp.sh.cvut.cz:80 Via: 1.1 ftp.sh.cvut.cz:80 (squid) Connection: keep-alive Délka: 734640128 (701M) [application/x-iso9660-image]
If-Modified-Since nebo If-Match? Pokud tam jsou, a server stejně pošle celý soubor, je to chyba serveru.
2011-02-19 22:15:11: (request.c.294) fd: 9 request-len: 309 GET /styl.css HTTP/1.0 Host: blok.hrach.eu User-Agent: Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp) Accept: text/css,*/*;q=0.1 Accept-Language: en-us,en;q=0.5 Accept-Encoding: gzip Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7 Referer: http://blok.hrach.eu/Na což server samozřejmě odpoví
200 a pošle celý styl.
::ffff:67.195.115.55 video.hrach.eu - [18/Jun/2010:01:10:49 +0200] "GET /video/vasut1.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.55 video.hrach.eu - [31/May/2010:17:01:29 +0200] "GET /video/scf10/scf-uvod.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.112.43 video.hrach.eu - [26/May/2010:17:29:31 +0200] "GET /video/vasut2.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.112.43 video.hrach.eu - [27/May/2010:02:56:06 +0200] "GET /video/vasut2.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:72.30.142.215 video.hrach.eu - [19/Nov/2010:17:42:27 +0100] "GET /video/vasut1.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:72.30.142.215 video.hrach.eu - [20/Nov/2010:02:06:21 +0100] "GET /video/scf10/malec-elektronicke-pasy.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:72.30.142.215 video.hrach.eu - [20/Nov/2010:15:56:26 +0100] "GET /video/vasut2.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.121 video.hrach.eu - [22/Nov/2010:11:11:03 +0100] "GET /video/vasut2.ogg HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)" ::ffff:67.195.115.121 video.hrach.eu - [19/Dec/2010:04:27:05 +0100] "GET /video/scf10/soufflot-access-for-enterprise.webm HTTP/1.0" 304 0 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"Etagy jsem zapnul (díky za tip), v lighttpd byly defaultně vypnuté.
If-Modified-Since nebo If-Match (na tu odpovědět nemůže, když ani neposílá E-tag), nemá klient jinou možnost, jak zjistit, zda nedošlo ke změně, než stáhnout celý soubor znova.
Pokud chcete robotům zakázat stahování nějaký souborů použijte /robots.txt.
Zakazování přístupu robotům na firewallu je nesmysl, robot může za chvíli chodit z jiné adresy, nebo přijde jiný robot. A hlavně ten robot nedělá nic špatného, chyba (a ne jedna) je jen na vaší straně.
Když váš server nedokáže správně odpovědět na hlavičky If-Modified-Since nebo If-Match (na tu odpovědět nemůže, když ani neposílá E-tag), nemá klient jinou možnost, jak zjistit, zda nedošlo ke změně, než stáhnout celý soubor znova.A, tak přecejenom, teď už můžete s klidem zapomenout, co jsem napsal k vašemu předchozímu příspěvku.
Když váš server nedokáže správně odpovědět na hlavičky If-Modified-SinceV některých případech (
*.webm) skutečně nedokázal, bug, opraveno (děkuju za upozornění). Ale Slurp vesele stahoval i všechno ostatní, kde se tahle hlavička posílala - Slurp totiž do požadavku hlavičku If-Modified-Since vůbec nevkládá.
nebo If-Match (na tu odpovědět nemůže, když ani neposílá E-tag)No, to je pravda, nechápu, proč to bylo ve výchozím nastavení vypnuté.
nemá klient jinou možnost, jak zjistit, zda nedošlo ke změně, než stáhnout celý soubor znovaKoukám, že lighttpd je v tomhle pěkně rozbitý software (klidně vnutí klientovi typ souboru, který si nevyžádal v
Accept, místo aby hodil 406), ale - opět - stejně bych si nepomohl, Slurp posílá v Accept i *. Podle mě by bylo mnohem vhodnější, kdyby si skutečně vyžádal jenom ty typy souborů, které indexuje.
Pokud chcete robotům zakázat stahování nějaký souborů použijte /robots.txt.To jsem hned udělal, čekám, až si ten soubor znovu vyžádá (na mirroru Archlinuxu už to udělal a už to celé nestahuje).
Zakazování přístupu robotům na firewallu je nesmysl, robot může za chvíli chodit z jiné adresy, nebo přijde jiný robot.Jasně, to mělo být dočasné řešení, protože o robots.txt žádá jenom občas (teď koukám do logu, že tak obden). Doufám, že tenhle zápisek a váš komentář alespoň někomu pomůže.
Ale Slurp vesele stahoval i všechno ostatní, kde se tahle hlavička posílala - Slurp totiž do požadavku hlavičku If-Modified-Since vůbec nevkládá.Vzhledem k tomu, že váš server posílá aktuální datum a čas, by ta hlavička stejně byla k ničemu.
Podle mě by bylo mnohem vhodnější, kdyby si skutečně vyžádal jenom ty typy souborů, které indexuje.Jste si jistý tím, že videa nijak neindexuje? Vyhledávače se snaží zaindexovat všechno, typ souboru budou nejspíš brát jenom jako pomocné kritérium. Pokud chcete indexování omezit, použijte
robots.txt, zbytek bych nechal na vyhledávači – jestli si myslí, že si poradí s videem, tak ať si ho klidně stáhne.
Vzhledem k tomu, že váš server posílá aktuální datum a čas, by ta hlavička stejně byla k ničemu.Kde? Nikde to tam nevidím.
--2011-02-19 23:38:06-- http://mirror.vpsfree.cz/archlinux/iso/latest/archlinux-2010.05-core-dual.iso Překládám mirror.vpsfree.cz… 83.167.228.98, 2a01:430:17:1::60 Navazuje se spojení s mirror.vpsfree.cz|83.167.228.98|:80… spojeno. HTTP požadavek odeslán, program čeká na odpověď… HTTP/1.0 200 OK Connection: keep-alive Content-Type: application/x-iso9660-image Accept-Ranges: bytes ETag: "1691149564" Last-Modified: Sun, 16 May 2010 14:30:16 GMT Content-Length: 691011584 Date: Sat, 19 Feb 2011 22:38:06 GMT Server: lighttpd/1.4.19A když mu pošlu třeba
If-modified-since: Fri, 18 Feb 2011 15:00:00 GMT, vrátí 304.
video.hrach.eu. Tam server neposílal ani ETag ani Last-Modified, jenom čas zpracování požadavku v hlavičce Date.
Last-Modified jen u souborů, u kterých neznal mime typ (tj. webm a mkv, vizte bug výše) a u dynamicky generovaného HTML (tj. index.php s různými parametry), ale teď už to těžko zjistíme. Ale ETagy se to spravilo, robot mi už posílá hlavičky typu If-None-Match: "29492511", takže mu můžu odpovídat 304. Takže uznávám, že chyba byla u mě, doplním řešení do zápisku.
Stejně mi ale přijde zajímavé, že se někomu vyplatí provozovat robota, který stahuje úplně všechno - když si vezmete, kolik existuje po světě zrcadel různých distribucí, každé o velikosti stovek GB, a spousta jich toto nemá zakázané v robots.txt, tak i když jejich servery mají správně nastavené cachování, robot se musí ustahovat.
Celkem chápu, že robot stahuje všechno – spousta serverů je špatně nakonfigurovaná, takže vrací třeba špatný mimetyp, dále jsou to chybné informace o kódování stránky nebo o jazyce… Robot, který by moc spoléhal na informace od uživatele, by spoustu věcí vůbec nenašel. Takže raději stahuje všechno a pak se v tom pokouší sám vyznat.