-
互聯(lián)網(wǎng)安全法,互聯(lián)網(wǎng)凈網(wǎng)行動
-
”凈網(wǎng)2020”落實好維護網(wǎng)絡(luò)安全責(zé)任
-
關(guān)于端午節(jié)放假通知-宇眾網(wǎng)絡(luò)
-
宇眾網(wǎng)絡(luò)春節(jié)放假通知
-
關(guān)于公司收款銀行賬戶變更通知函-宇眾網(wǎng)絡(luò)
-
關(guān)于網(wǎng)上有人冒充我公司名義進行詐騙的公告。
-
關(guān)于端午節(jié)放假通知,節(jié)日放假,但是我們業(yè)務(wù)不“放假”-宇眾網(wǎng)絡(luò)
-
工信部進一步加強未備案網(wǎng)站管理工作的通知-宇眾網(wǎng)絡(luò)
-
關(guān)于東莞市宇眾網(wǎng)絡(luò)科技有限公司香港數(shù)據(jù)中心(香港機房)路由優(yōu)化通知
-
宇眾網(wǎng)絡(luò)慶祝五·一勞動節(jié)快樂
-
東莞東城機房網(wǎng)絡(luò)升級通知
-
臨近過年,互聯(lián)網(wǎng)IDC貴圈也有被騙的,請認(rèn)準(zhǔn)宇眾網(wǎng)絡(luò)公司官方聯(lián)系方式
-
我司已獲得ISP/ICP/IDC三證資格,更好的為客戶服務(wù)
-
關(guān)于浙江金華高防機房網(wǎng)絡(luò)線路切割通知
-
工信部近日下發(fā)關(guān)于進一步規(guī)范域名備案工作的通知
行業(yè)資訊
- 首頁
- 新聞中心
- 行業(yè)資訊
如果讓更多的百度蜘蛛能正常的爬行我的網(wǎng)站?查詢百度蜘蛛來訪記錄
對于很多做網(wǎng)站的新手來說,都沒有經(jīng)過系統(tǒng)地授課進行網(wǎng)絡(luò)技術(shù)和建站知識學(xué)習(xí),做網(wǎng)站都是靠自學(xué),遇到難題在論壇發(fā)帖提問,更不會懂得網(wǎng)站優(yōu)化,對于較基本操作——通過網(wǎng)站日志看蜘蛛來訪情況都不知到哪里看,怎么看。前兩天看到很多人發(fā)帖提問,回復(fù)者的答案卻比較精煉,不具體,提問者還是云里霧里的,現(xiàn)我就以自己的網(wǎng)站來系統(tǒng)地操作一次,提交給大家參考,有說錯的地方,請批評指正。
什么是spider?(引擎蜘蛛)
spider是搜索引擎的一個自動程序。它的作用是訪問互聯(lián)網(wǎng)上的html網(wǎng)頁,建立索引數(shù)據(jù)庫,使用戶能在搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁。
spider對一個網(wǎng)站服務(wù)器造成的訪問壓力如何?
spider會自動根據(jù)服務(wù)器的負(fù)載能力調(diào)節(jié)訪問密度。在連續(xù)訪問一段時間后,spider會暫停一會,以防止增大服務(wù)器的訪問壓力。所以在一般情況下,spider對您網(wǎng)站的服務(wù)器不會造成過大壓力。
為什么spider不停的抓取我的網(wǎng)站?
對于您網(wǎng)站上新產(chǎn)生的或者持續(xù)更新的頁面,spider會持續(xù)抓取。此外,您也可以檢查網(wǎng)站訪問日志中spider的訪問是否正常,以防止有人惡意冒充spider來頻繁抓取您的網(wǎng)站。如果您發(fā)現(xiàn)spider非正常抓取您的網(wǎng)站,請發(fā)送反饋郵件到該搜索引擎,并請盡量給出spider對貴站的訪問日志,以便于我們跟蹤處理。
我不想我的網(wǎng)站被spider訪問,我該怎么做?
spider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止spider訪問您的網(wǎng)站,或者禁止spider訪問您網(wǎng)站上的部分文件。注意:禁止spider訪問您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁,在搜索引擎以及所有提供搜索引擎服務(wù)的搜索引擎中無法被搜索到。
關(guān)于robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法
為什么我的網(wǎng)站已經(jīng)加了robots.txt,還能在搜索出來?
因為搜索引擎索引數(shù)據(jù)庫的更新需要時間。雖然spider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁,但搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息,可能需要二至四周才會清除。另外也請檢查您的robots配置是否正確。
蜘蛛在robots.txt中的名字是什么?
“spider”全部為小寫字母。
spider多長時間之后會重新抓取我的網(wǎng)頁?
搜索引擎每周更新,網(wǎng)頁視重要性有不同的更新率,頻率在幾天至一月之間,spider會重新訪問和更新一個網(wǎng)頁。
知道了什么是SPIDER蜘蛛,那么怎么才能知道蜘蛛是否來過你的站?這個可以從你服務(wù)器或者虛擬主機的日志中看出來,比如我用的站的www.jindaxi.cn的完整使用日志中有這樣的記錄:
220.181.38.198 - - [11/Nov/2007:04:28:29 +0800] "GET / HTTP/1.1" 200 61083 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"這就說明蜘蛛來過我的站了,如果你還想知道有沒有其它搜索引擎的蜘蛛來過你的站,你可以在日志文件中搜索“spider”這個詞,或者搜索蜘蛛的IP。