亚洲精品高清国产一久久,亚洲av永久无码精品网站在线观看,亚洲精品tv久久久久久久久久,亚洲,另类,激情av在线播放,亚洲av成人一区二区三区在线看

首頁 首頁 >  文章資訊

網(wǎng)站域名“變變變”:新米都比舊的好嗎

發(fā)布者:feixue2017    發(fā)布時間:2018-07-02 09:53:43    瀏覽次數(shù):210次

1、基于查詢會話的方法


大家都知道,搜索引擎會統(tǒng)計分析用戶的搜索行為,將此轉(zhuǎn)化為查詢會話。然后通過各種數(shù)據(jù)挖掘算法來對查詢會話進行統(tǒng)計處理,如果一個查詢詞a和查詢詞b經(jīng)常一起出現(xiàn),那么自然,我們可以認為兩者是相互關(guān)聯(lián)且值得推薦的。


當然,這樣做也會有兩個很明顯的問題暴漏了出來,用戶的一次連續(xù)的查詢可能不是針對的同一個主題,這樣,在對用戶的兩次查詢進行拆分時,很難精準的進行切割。同時,該方法是以單個用戶的查詢會話作為基礎(chǔ)來統(tǒng)計的,所以在對數(shù)據(jù)進行挖掘時不能體現(xiàn)不同用戶查詢之間的關(guān)聯(lián)。


2、基于點擊圖的方法


當然,在用戶的搜索日志中,除了簡單的查詢之外,還有對站點的點擊數(shù)據(jù)。如果能將此利用起來,也不失為一種很好的查詢相關(guān)搜索的方法。


一個簡單的邏輯為:


用戶查詢了關(guān)鍵詞p,然后點擊了網(wǎng)址D1和D2分別6次和8次,那么此時我們就可以針對p建立起一個向量[0,6,8,0],針對另一個查詢詞q同樣可以建立起對應的向量。


OK,這就再次回到了根據(jù)空間向量計算相似度的模型中。既定相似度大于某個值,則這兩種搜索即為相關(guān)。


當然,如果需要做的嚴謹一些,就需要將被點擊的內(nèi)容之間的相似度計算考慮在內(nèi)。因為不同的鏈接地址對應相同或相似內(nèi)容的現(xiàn)象在搜索引擎中屢見不鮮。


天津博大醫(yī)院

【版權(quán)與免責聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息發(fā)郵件至 1830498703@qq.com ,我們將及時溝通刪除處理。 以上內(nèi)容均為網(wǎng)友發(fā)布,僅代表網(wǎng)友個人觀點,不代表平臺觀點,涉及言論、版權(quán)與本站無關(guān)。