Portál AbcLinuxu, 12. května 2025 13:13

Dotaz: Jak schovat ROBOTS.TXT

29.7.2010 14:32 Honza-hloupý
Jak schovat ROBOTS.TXT
Přečteno: 502×
Odpovědět | Admin
Ahoj lidi, 

mohl by mi někdo poradit to jak schovám soubor robots.txt před pot. útočníkem.... potřebuju schovat adresare před roboty ale nemohu pouzit meta nofollow z duvodu velkeho mnozstvi stranek, takže pouzivam robots.txt. díky honza

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

poky74 avatar 29.7.2010 14:34 poky74 | skóre: 36 | blog: Zápisník | Vrchlabí
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Odpovědět | | Sbalit | Link | Blokovat | Admin

Když útočník "najde" robots.txt, k čemu mu to asi bude?

Chcete Linuxové samolepky nebo Tuxe na klíče? ->
29.7.2010 14:37 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
No asi k tomu, že uvidí to co neni zaindexovane, tudiz muze byt admin brana, nebo cokoliv na co bude utocit...clear?
29.7.2010 14:38 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
No asi k tomu, že uvidí to co neni zaindexovane a indexovat se rozhodne nema, tudiz muze byt admin brana, nebo cokoliv na co bude utocit...clear?
poky74 avatar 29.7.2010 14:41 poky74 | skóre: 36 | blog: Zápisník | Vrchlabí
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT

Tak snad to máte pojištěné ne? Určitě to někdo najde i bez toho robots

Chcete Linuxové samolepky nebo Tuxe na klíče? ->
29.7.2010 14:37 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Odpovědět | | Sbalit | Link | Blokovat | Admin
Jedině smazat a robotům ho posílat poštou :D
29.7.2010 14:39 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
napadá mě jenom NĚJAK pomocí rewrite, ale jak?
29.7.2010 14:43 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
tak přece jenom...nejlepší je se zeptat a i odpovědět :)

RewriteRule ^(.*)/robot.txt cokoliv.cokoliv

nějaké jiné řešení?
29.7.2010 14:54 Filip Jirsák | skóre: 68 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Jak chcete odlišit robota od útočníka? Pokud je nedokážete odlišit, schováte robots.txt buď všem (robotům i útočníkům), nebo nikomu.

Je nesmysl pokoušet se skrývat robots.txt – buď v nich máte adresy, které nikd ejinde nejsou a vyhledávač je žádným způsobem nemůže zjistit (pak jsou tam ale zbytečně), nebo tam máte adresy, které může vyhledávač znát, tím pádem je ale stejně tak může znát i útočník a schovávání robots.txt ničemu nepomůže, protože ty stránky stejně musíte zabezpečit nějak jinak.
29.7.2010 15:46 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
ještě jsem vygooglil tohle

do .htaccess pomoci rewrite:

RewriteCond %{HTTP_USER_AGENT} ^Mozilla  RewriteCond %{HTTP_USER_AGENT} !(Slurp¦surfsafely) RewriteRule ^robots\.txt$ /nejakejjinejsoubor-treba index.php [L]

a funguje to...koukal jsem do logu a prave prese mne prosvistel googlebot
Luboš Doležel (Doli) avatar 29.7.2010 15:54 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Takže až se budu chtít podívat na váš robots.txt, akorát si nastavím User-Agent na googlebota :-)
29.7.2010 16:02 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
hmm...nevim sice jak nastavit agenta na googlebota...ale tedy napada nekoho nejake reseni?
Luboš Doležel (Doli) avatar 29.7.2010 16:06 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Řešení neexistuje. Především řešíte neexistující problém. Že někdo zná URL vaší admin zóny, to ničemu nevadí. Že se dá do té admin zóny třeba nějak "vloupat", to vadí a na to se zaměřte.
29.7.2010 16:13 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Je na to třeba doplněk do firefoxu, jako google se člověk často dostane i tam, kam by se jinak třeba nedostal (chtělo by to po něm heslo, captcha a podobné).
Jendа avatar 29.7.2010 20:17 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
poky74 avatar 29.7.2010 16:02 poky74 | skóre: 36 | blog: Zápisník | Vrchlabí
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT

To ti ale vůbec nepomůže, identifikace prohlížeče se dá libovolně měnit.

Chcete Linuxové samolepky nebo Tuxe na klíče? ->
29.7.2010 16:13 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
aha ...takže ani to že bych pripadne nejak rozeznaval bota od sufr. cloveka mi pomoci nema? prislo mi to jako nejlepsi ...hned od prvniho kontaktu z webem bud mu dam index(clovek) nebo kdyby to byl bot tak i robots.txt....tak nevim teda
29.7.2010 16:27 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Ale robots.txt přece nebude surfující útočník číst ručně. Na to si postaví robota ;) Co uděláte?
29.7.2010 16:25 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Řešení to není, pouze budete nabízet nějaký jiný soubor cokoliv.cokoliv pod názvem robots.txt, a to jak robotům, tak útočníkům.

Jste v situaci jako kdybyste chtěl robotům zpřístupnit index.html a útočníkům ne. Nejde to.

Ale i kdyby se k vám roboti a útočníci připojovali a identifikovali se certifikátem, stále můžete narazit na filozofické dilema, pokud útočník naprogramuje útočícího robota. Jak se s tím poperete? Povolit, nepovolit... :D
29.7.2010 16:32 Honza-hloupý
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Rozumím a děkuji
29.7.2010 16:46 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Pokud vám jde o to, aby robots.txt někdo nepoužíval jako rozcestník, lze možná (?) udělat to, co jsem teď někde zahlédl, že radili uvádět jen začátek názvů adresářů/souborů.

Například pro adresář /adresarstajnymnazvem/ a soubor souborstajnymnazvem.html:
robots.txt

User-Agent: *
Disallow: /adresarstaj/
Disallow: /souborstaj
Je mi divné že by to takto fungovalo, člověk by si snadno zablokoval něco co nechtěl, ale možné to je :)

Ovšem pozor, opět platí to co už bylo řečeno, pokud na ty stránky nevede veřejný link, tak se na ně nedostane ani robot a není potřeba je v robots.txt vůbec mín, a pokud na ně link existuje, útočník je může stejně najít buď ručně, nebo svým robotem, nebo nějakým veřejným robotem který robots.txt ignoruje.
29.7.2010 16:37 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Odpovědět | | Sbalit | Link | Blokovat | Admin
http://www.robotstxt.org/faq/nosecurity.html
31.7.2010 09:30 JF | skóre: 23
Rozbalit Rozbalit vše Re: Jak schovat ROBOTS.TXT
Odpovědět | | Sbalit | Link | Blokovat | Admin
Podle me je uplna blbost utajovat robots.txt.

Pokud mas nejaky tajny adresar a zakazes ho v robots.txt, tak i kdyz znas jmeno adresare nepujde snadno zjistit co v nem je za podadresare. Pokud treba zakazes robotum indexovat adresar /1 a v nem mas adresar /1/tajne, tak apache ti neda sanci abys zjistil, jmeno adresare. Stranka se zobrazy pouze, kdyz zadas plne jmeno /1/tajne/soukromy.html

A pokud se bojis zaindexovani zkus tuto techniku: http://www.monkeys.com/cgi-bin/wpoison/wpoison.cgi Generuj stranku unikatne a jednorazove. Takze kazdy, kdo si stranku prohledne uz nikdy stranku s tim samym nazvem nezobrazi.

A nebo vsechny stranky osetri klicem /soukromy.cgi?2C8B52WHKXBML, ktery se bude generovat per user.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.