Portál AbcLinuxu, 21. května 2025 14:12
Přičemž všichni ostatní roboti v pohodě (Google, Yahoo a nějací další), kdežto Seznam stáhne vždy jen /robots.txt a / a konec... netuším co s tím - navíc se mi moc nedaří to nasimulovat telnetem a předpokládám že tedy někde mám chybu... Tohle je záznam od SeznamBot:
77.75.73.123 - - [29/Nov/2010:15:33:55 +0100] "GET /robots.txt HTTP/1.1" 200 321 "-" "SeznamBot/2.0 (+http://fulltext.sblog.cz/robot/)" 77.75.73.123 - - [29/Nov/2010:15:33:55 +0100] "GET / HTTP/1.1" 200 3677 "-" "SeznamBot/2.0 (+http://fulltext.sblog.cz/robot/)"
Jedná se o webovku www.sigut.net
když spustím telnet sigut.net 80 GET /robots.txt
Tak dostanu obsah robots.txt (zkoušel jsem i prázdný)
když to zkouším s parametrem host:
telnet sigut.net 80 Trying 77.93.223.102... Connected to sigut.net. Escape character is '^]'. GET /robots.txt HTTP1.1 Host: sigut.net
Tak dostanu mimo jiné.. The document has moved http://www.sigut.net/robots.txt here.
Nastavení apache pro danou doménu:VirtualHost *:80 ServerName sigut.net ServerAlias *.sigut.net DocumentRoot /home/sigut-net/public_html/violet5/current/public RailsEnv production Directory /home/phax/public_html/violet5/public AllowOverride all Options -MultiViews /Directory CustomLog /var/log/apache2/sigut.net.log combined /VirtualHost
Nemohl by to někdo zkusit nebo poradit v čem bych mohl mít chybu? Zítra zkusím zavolat do Seznamu na tu jejich hotline ale obávám se že to bude velmi stresující zážitek kterému bych se rád vyhnul:) Ten bot chodí zpátky co 2 dny tak se to dost blbě testuje:( Díky moc!
V poradně jsem se ptal trochu nespecificky a teď už se bojím že to možná ani nesouvisí s Linuxem...
Tiskni
Sdílej:
a je vám známo, že seznamácký bot indexuje pouze české (=česky psané) stránky?Citation needed.
IMHO je to problém pouze vyhledávačů a nemá cenu se o to staratAno, je to problém vyhledávačů (tedy konkrétně Seznamu), ale to zákazníky obvykle nezajímá. Když se na Seznamu nenajdou, je to špatné. Bez ohledu, jaký ta nepřítomnost má důvod. Totéž se týká i pošty. Když nechodí pošta na Seznam, může za to provozovatel mailserveru, protože odjinud (rozuměj: z adresy ????@seznam.cz) to přece funguje bez problémů.
Od dneska ještě někdo vyhledávání seznam používá?Většina českých BFU. Mnozí ho mají nastaven jako výchozí stránku a i URL zadávají do jeho vyhledávacího pole (namísto adresního řádku).
Já osobně využuji pouze ten jejich katalog, kam se to beztak zadává ručně a třídí podle kategorií (geografických, tematických, atd...)Ten jejich katalog je kapitola sama pro sebe. Ne z hlediska vyhledávání, ale při vkládání firemních záznamů. Popisky mění k obrazu svému, často nesmyslně zamítají záznamy nebo jejich úpravy. Vše směřuje k jedinému - natlačit do (drahých) placených služeb. Má to logiku, protože cílem je samozřejmě vydělávat. Ale při jejich chování (obecně) bych jim nedal ani korunu.
Pokud si chci koupit kafe nebo sháním kominíka, nebudu se ptát Yaahhoo nebo Gooogle.Já se naopak Googlu zeptám. Protože mi dá rozumné výsledky.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.