搜索引擎系統(tǒng)是最復(fù)雜的計(jì)算系統(tǒng)之一,當(dāng)今主流搜索引擎服務(wù)商都是有財(cái)力,人力的大公司。即使有技術(shù),人力,財(cái)力的保證,搜索引擎還是面臨很多技術(shù)挑戰(zhàn)。搜索引擎主要面臨那幾種挑戰(zhàn)?
1、頁(yè)面抓取需要快而全面:
互聯(lián)網(wǎng)是一個(gè)動(dòng)態(tài)的內(nèi)容網(wǎng)絡(luò),每天有無(wú)數(shù)頁(yè)面被更新,創(chuàng)建,無(wú)數(shù)用戶在網(wǎng)站上發(fā)布內(nèi)容,溝通聯(lián)系。要返回最有用的內(nèi)容,搜索引擎就要抓取最新的頁(yè)面。
2、海量數(shù)據(jù)存儲(chǔ):
一些大型網(wǎng)站單是一個(gè)網(wǎng)站就有百萬(wàn)千萬(wàn)個(gè)頁(yè)面,可以想象網(wǎng)上所有網(wǎng)站的頁(yè)面加起來(lái)是一個(gè)什么數(shù)據(jù)。http://yyk.fh21.com.cn/yiyuan_tyjlmnwkyy/tsyl/
3、搜索處理快速有效,具可擴(kuò)展性:
搜索引擎將 頁(yè)面數(shù)據(jù)抓取和儲(chǔ)存后,還要進(jìn)行索引處理,包括鏈接關(guān)系的計(jì)算,正向索引,倒排索引等。http://yyk.fh21.com.cn/yiyuan_tyjlmnwkyy/ys/
4、查詢處理快速準(zhǔn)確:
查詢是普通用戶唯一能看到的搜索引擎工作步驟。用戶在搜索框輸入關(guān)鍵詞,單擊“搜索”按鈕后通常不到一秒就會(huì)看到搜索結(jié)果。表面最簡(jiǎn)單的過(guò)程,實(shí)際上涉及非常復(fù)雜的后臺(tái)處理。
【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息發(fā)郵件至 1830498703@qq.com ,我們將及時(shí)溝通刪除處理。 以上內(nèi)容均為網(wǎng)友發(fā)布,僅代表網(wǎng)友個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),涉及言論、版權(quán)與本站無(wú)關(guān)。