搜索引擎蜘蛛抓取配額的相關問答
發布日期:2020/07/15 作者: 祥雲時代 點擊:
抓取份額是搜索引擎蜘蛛花在一個網站上的抓取頁麵的總的時間上限。
一、什麽是搜索引擎蜘蛛抓取份額?
顧名思義,抓取份額是搜索引擎蜘蛛花在一個網站上的抓取頁麵的總的時間上限。對於特定網站,搜索引擎蜘蛛花在這個網站上的總時間是相對固定的,不會無限製地抓取網站所有頁麵。
抓取份額的英文Google用的是crawl budget,直譯是爬行預算,我覺得不太能說明是什麽意思,所以用抓取份額表達這個概念。
抓取份額是由什麽決定的呢?這牽扯到抓取需求和抓取速度限製。
二、抓取需求
抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網站多少頁麵。
決定抓取需求的主要有兩個因素。一是頁麵權重,網站上有多少頁麵達到了基本頁麵權重,搜索引擎就想抓取多少頁麵。二是索引庫裏頁麵是否太久沒更新了。說到底還是頁麵權重,權重高的頁麵就不會太久不更新。
頁麵權重和網站權重又是息息相關的,提高網站權重,就能使搜索引擎願意多抓取頁麵。
三、抓取速度限製
搜索引擎蜘蛛不會為了抓取更多頁麵,把人家網站公司服務器拖垮,所以對某個網站都會設定一個抓取速度的上限,crawl rate limit,也就是服務器能承受的上限,在這個速度限製內,蜘蛛抓取不會拖慢服務器、影響用戶訪問。
服務器反應速度夠快,這個速度限製就上調一點,抓取加快,服務器反應速度下降,速度限製跟著下降,抓取減慢,甚至停止抓取。
所以,抓取速度限製是搜索引擎“能”抓取的頁麵數。