一、蜘蛛抓取差異
我一直喜歡觀察蜘蛛行蹤,筆者在許多站長群里面被稱為“蜘蛛俠”,就是來源于我的這個習慣和愛好。這次上新站這樣的機會是肯定不能錯過的。網站內容上傳完畢后,首先去幾個門戶論壇發(fā)帖回復引蜘蛛,幾個小時后訪問日志已經產生了,百度蜘蛛的速度較快,在谷歌之前來到了網站。通過日志查看,谷歌的蜘蛛非常有趣,反復爬取robots文件10多次以后才小心翼翼的抓取首頁,之后一邊爬取robots一邊抓取網站內頁。而百度蜘蛛則顯得比較著急,我的網站是制作了robots文件的,但是百度并不爬取此文件,直接去抓取網站首頁,而且顯得非常饑餓和瘋狂,在1分鐘內,反復爬取首頁20多次,之后再去抓取內頁。返回狀態(tài)碼200 0 0,表示全部抓取成功。感興趣的朋友可以到我的網站查看昨天的蜘蛛抓取日志,一個新站的抓取過程,對于研究蜘蛛的規(guī)律和性格有非常不錯的參考價值。
從上面的過程可以看出,谷歌的蜘蛛比較有禮貌和注重禮儀規(guī)矩,會反復敲門得到陌生新主人許可后才進去,之后的每一個行為都參照robots規(guī)則來進行內頁的抓取,讓我想起了解放軍的三大紀律八項注意,在這里贊一個。而百度蜘蛛忽略robots,進門反復咬首頁10多口才放手的行為,讓人感覺很暴力很野蠻,蜘蛛吃完首頁繼續(xù)吃內頁,這個過程中百度蜘蛛完全無視robots文件的存在。
二、網站收錄差異
幾小時后site谷歌,已經收錄了新站的2個頁面,其次是搜搜在24小時內收錄了首頁。新站到現在為止已經誕生30多小時了,而百度至今還沒放出首頁。由于搜索機制和規(guī)則不一樣,目前來說新站收錄效率來講谷歌最給力,百度慢了好幾拍。
以上分享的是筆者的新站在谷歌和百度抓取和收錄過程中的差異,希望通過這個案例,給研究SEO的朋友和需要上新站的朋友一些學習參考和靈感,讓你更了解谷歌百度的抓取規(guī)則和收錄流程。
Copyright © 2007-2015 深圳博盈網絡技術 All Rights Reserved . 嚴禁以任何形式進行復制、抄襲!
公司地址:深圳市龍華新區(qū)龍華街道辦山咀頭綜合辦公大樓9樓915室 (龍華街道辦、|華潤萬家,佳華商場、友誼書城等旁)
聯(lián)系電話:0755-29008907 15989449358 咨詢信箱:boryin@boryin.com sales@boryin.com