Portál AbcLinuxu, 22. května 2024 06:47


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Vložit další komentář
4.3.2008 08:59 x
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Odpovědět | Sbalit | Link | Blokovat | Admin
At zijou informace ziskane crawlery!
4.3.2008 09:00 misch
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Odpovědět | Sbalit | Link | Blokovat | Admin
Jak konkrétně se dá zmíněná stránka (http://www.linux-watch.com/news/NS8274710475) donutit aby vrátila datum česky?

V browseru sice mám správně nastavenou preferenci češtiny, ale přesto když se na ten web podívám, tak mi vrací i záhlaví anglicky. A odkaz na přepnutí jazyka tam nikde nevidím.
4.3.2008 09:14 nightfish | skóre: 9
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Odpovědět | Sbalit | Link | Blokovat | Admin
vypadá to, že google "překládá" datum do jazyka, ve kterém se vyhledává (parametr "hl" v url)
zkuste si tu stránku najít tak, aby tam bylo to úvodní datum a změňte "hl" z "cs" na "en" nebo obráceně a uvidíte, že datum je jednou česky a po druhé anglicky
4.3.2008 18:12 depka
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Odpovědět | Sbalit | Link | Blokovat | Admin
Ať žije traffic způsobovaný crawlery! ;-P
jaky trafic? jeden prohlizejici uzivatel navic....
Heron avatar 4.3.2008 18:20 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Přesně tak a google crawler (i indexer) se chová (na rozdíl od některých uživatelů) k serveru velmi ohleduplně.
4.3.2008 19:41 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Neřekl bych. Mě robot z Googlu opakovaně tahá 25MB DjVu soubor, přičemž se datum změny toho souboru vůbec nemění. I když je možné, že to je tím, že stáhnutí trvá tak dlouho, že to vždycky vzdá v půlce a za několik dnů to zkouší znovu.
Heron avatar 4.3.2008 20:18 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
Tak tohle ale nevytěžuje server, pouze lajnu*. Já to myslel tak, že na rozdíl od jedinců, kteří jsou schopni mirrorovat web v 60 threadech, tak google navštěvuje stránky postupně a to ještě je s časovými rozestupy.

*) Jaký máš upload? Třeba dlouhé stahování toho souboru indexer vyhodnotí jako přetíženou linku a raději toho (s ohleduplnosti) nechá.
5.3.2008 11:26 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
128 kb/s (co bychom mohli chtít po Telecomu). Pravděpodobně je to tak. Jen mi to přijde jako diletantismus. Obzvláště když server podporuje zasílání časti souboru.
5.3.2008 11:29 misch
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
A posílá server vůbec hlavičku "Expires", atd.? Mohl bys sem dát odkaz na ten soubor, třeba bychom z toho pak něco zjistili. Říct "crawler dělá chybu" je snadné, ale lepší by bylo si to tvrzení (které klidně může být pravdivé) ověřit.
5.3.2008 20:54 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Indexuje google pro každý jazyk zvlášť?
28 MiB velký soubor

Žádná hlavička Expires tam není, neb server nemůže vědět, kdy se dokument změní. To ať si řeší proxy servery (nebo roboti) heuristikou podle Last-Modified a metody HEAD.
HTTP/1.0 200 OK
Server: thttpd/2.25b 29dec2003
Content-Type: image/vnd.djvu
Date: Wed, 05 Mar 2008 19:49:19 GMT
Last-Modified: Wed, 29 Aug 2007 15:39:37 GMT
Accept-Ranges: bytes
Connection: close
Content-Length: 29414015
Ostatně Googlebot/2.1 to už asi vzdal, protože logy o tomto souboru se už odrotovaly.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.