搞過網(wǎng)站的朋友都知道robots.txt文件是用來限制搜索引擎不亂抓取,只抓取我們希望被收錄的內(nèi)容的。比如我們網(wǎng)站的后臺(tái)就不希望被搜索抓取,那么robots文件需要這樣寫:
User-agent: *
Disallow: /admin/
但是這樣我們很容易發(fā)現(xiàn)了一個(gè)問題,如果有人要破解攻擊的話,很容易就知道了后臺(tái),一下子就清楚了網(wǎng)站的結(jié)構(gòu)。
我們并不想這樣!
有沒有辦法讓robots.txt既能限制搜索引擎,又不泄露后臺(tái)地址和隱私目錄呢?有!
一、使用通配符(*):
User-agent: *
Disallow: /a*/
這樣的寫法,禁止所有的搜索引擎抓取根目錄下a開頭的目錄。當(dāng)您的后臺(tái)是admok165的話,還有誰會(huì)看到呢?
二、只寫目錄前幾個(gè)字母,不寫全:
User-agent: *
Disallow: /ad
這種的寫法,是禁止所有的搜索引擎抓取根目錄下ad開頭的目錄。
最后說明一下,以上這兩種方法,需要網(wǎng)站目錄沒有相同字母開頭的,例如ad目錄,如果有兩個(gè)一樣的,那需在robots.txt文件里再加上一個(gè)字母區(qū)別開來。
聲明:本站所有文章,如無特殊說明或標(biāo)注,均為本站原創(chuàng)發(fā)布。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。