大量采集頁面
大量的采集頁面,一般情況下一個(gè)網(wǎng)站有600-1200萬頁面左右,當(dāng)然采集的方法并不是采集一個(gè)網(wǎng)站的,而是按照關(guān)鍵詞來采集,一個(gè)關(guān)鍵詞一個(gè)頁面,常規(guī)采集是按照一個(gè)關(guān)鍵詞分配多個(gè)頁面,而此類黑帽技術(shù),是通過一個(gè)關(guān)鍵詞一個(gè)頁面進(jìn)行。
以視頻圖片為主
文字是html里面最基礎(chǔ)的技術(shù),所以搜索引擎對(duì)文字識(shí)別技術(shù)已經(jīng)達(dá)到了一定的境界,在采集過程中搜索引擎是可以對(duì)比出網(wǎng)站是否出現(xiàn)采集,所以此類黑帽站點(diǎn)是以圖片和視頻為主,主要目的是圖片搜索引擎的識(shí)別能力。
迷宮式內(nèi)鏈
在內(nèi)容頁的時(shí)候主要以圖片視頻為主,但內(nèi)容頁的內(nèi)鏈主要以相關(guān)鏈接和推薦鏈接為主做內(nèi)鏈優(yōu)化,而每一個(gè)頁面的相關(guān)鏈接和推薦鏈接都不一樣,所以突破了普通cms的相同推薦。搜索引擎更具此類鏈接爬行是永遠(yuǎn)找不到相同的內(nèi)鏈,這也很難讓搜索引擎從此類站點(diǎn)爬行出去。
域名優(yōu)勢(shì)
通常的情況下搜索引擎會(huì)對(duì)一個(gè)新站進(jìn)行考核,考核時(shí)間大概在3個(gè)月左右,為了避免考核時(shí)間延遲,這種黑帽技術(shù)都是直接購買二手域名,或者是直接使用某一個(gè)時(shí)間較長的網(wǎng)站利用欄目頁做類似的黑帽技術(shù),一般情況下建議使用老站欄目做此類黑帽技術(shù),畢竟網(wǎng)站未出現(xiàn)改版而是直接增加網(wǎng)站內(nèi)容資源。
PS:以上的內(nèi)容都是我個(gè)人的揣測,也有很多問題讓我困惑的,希望大家在本文能夠互動(dòng)起來,一起分析出原因,比較研究出來后大家可以一起享受這類網(wǎng)站帶來的收益。
問題一:采集內(nèi)容
采集的內(nèi)容以圖片為主,通常情況下一個(gè)大型網(wǎng)站的圖片、視頻都做過防盜的手段,所以在采集上面會(huì)出現(xiàn)采集后圖片打不開或者出現(xiàn)防盜的字樣。
問題二:收錄問題
如果是一個(gè)老站,自然是收錄不成問題,如果是一個(gè)新域名新網(wǎng)站,那需要前面做正規(guī)網(wǎng)站,但是時(shí)間問題,直接做成黑帽站那即會(huì)出現(xiàn)不收錄,采集任何內(nèi)容均出現(xiàn)不收錄現(xiàn)象。