索引量和收錄量的區(qū)別
一. 索引量
索引量是指通過(guò)搜索引擎蜘蛛爬到網(wǎng)站內(nèi)容頁(yè)面,然后把內(nèi)容放到一個(gè)臨時(shí)的數(shù)據(jù)庫(kù)當(dāng)中。通過(guò)分析處理進(jìn)行一系列的算法操作,各種規(guī)則的篩選,將對(duì)低質(zhì)量的頁(yè)面進(jìn)行清理掉。當(dāng)然對(duì)于那些高質(zhì)量的頁(yè)面將轉(zhuǎn)移到索引庫(kù)當(dāng)中。比如會(huì)對(duì)于頁(yè)面的分類,頁(yè)面的評(píng)分,頁(yè)面的排名等處理,當(dāng)這些計(jì)算完成后,放入索引庫(kù)里面。我們?cè)谒阉饕娈?dāng)中搜索到的內(nèi)容,都是從索引庫(kù)當(dāng)中進(jìn)行提取地址來(lái)顯示出來(lái)的。
二.網(wǎng)站收錄
收錄的概念,是非常廣泛,對(duì)于一般的來(lái)說(shuō),是指當(dāng)蜘蛛爬蟲(chóng)在爬取網(wǎng)站頁(yè)面,并將頁(yè)面內(nèi)容入到臨時(shí)數(shù)據(jù)庫(kù)當(dāng)中的過(guò)程。
總結(jié):
收錄:網(wǎng)頁(yè)被百度蜘蛛抓取過(guò);
索引:網(wǎng)頁(yè)被百度蜘蛛分析過(guò),有意義則建立索引庫(kù),無(wú)意義直接清除;
先收錄才可以建索引,收錄量大于索引量。因此一般收錄量都會(huì)大于索引量!
怎樣提高收錄量。主要分為三個(gè)方面
1. 提高頁(yè)面內(nèi)容質(zhì)量
對(duì)于網(wǎng)站頁(yè)面的質(zhì)量是非常關(guān)鍵,雖然你在網(wǎng)站內(nèi)部和網(wǎng)站外部其它網(wǎng)站設(shè)置了很多的入口,如果你的網(wǎng)站頁(yè)面的內(nèi)容質(zhì)量很低的話,那個(gè)這個(gè)頁(yè)面的收錄機(jī)率就會(huì)很小,對(duì)于網(wǎng)站頁(yè)面內(nèi)容質(zhì)量搜索引擎是相當(dāng)?shù)目粗?。所以我們需要提高?yè)面的質(zhì)量,多采用原創(chuàng)的方式來(lái)寫(xiě),其它還包括,url結(jié)構(gòu)的設(shè)置,內(nèi)容的相關(guān)性等等,對(duì)整個(gè)網(wǎng)站的權(quán)重都是會(huì)有影響的。
http://www.wuweicm.com/thread-5555-1-1.html
2. 設(shè)置頁(yè)面訪問(wèn)的入口
我們蜘蛛爬蟲(chóng)來(lái)問(wèn)我們的網(wǎng)站,都需要一個(gè)入口,就像進(jìn)屋的門(mén)一樣,我們需要進(jìn)了屋后,再進(jìn)行其它的操作,當(dāng)然對(duì)于一個(gè)頁(yè)面來(lái)說(shuō),千萬(wàn)不要里面沒(méi)有任何的鏈接。這樣的網(wǎng)頁(yè),就像是一個(gè)狐島一樣,這些都不能發(fā)生。我們需要對(duì)每一個(gè)頁(yè)面進(jìn)行設(shè)置,爬蟲(chóng)是根據(jù)網(wǎng)站里面的一個(gè)一個(gè)的鏈接來(lái)訪問(wèn)的。如果斷了,對(duì)于有些頁(yè)我們就訪問(wèn)不了,也不可能被收錄了。索引量和收錄量的區(qū)別
3. 收錄的規(guī)則
對(duì)于蜘蛛爬蟲(chóng)都有自己的規(guī)律可循,都會(huì)有自己的一套規(guī)則,我們大家所認(rèn)為比較廣泛的說(shuō)法是。越大的網(wǎng)站,收錄得越快并優(yōu)先。對(duì)于權(quán)威越高的網(wǎng)站越快并優(yōu)先,權(quán)重越高的越快并優(yōu)先,新聞文章類的優(yōu)先,等等,一系列規(guī)則,對(duì)于我們來(lái)說(shuō),只需要提高網(wǎng)站內(nèi)容的更新頻率,提高網(wǎng)站內(nèi)容質(zhì)量,從頻率與數(shù)量下做文章。