總體而言,應(yīng)用于搜索引擎中的Web個(gè)性化信息推薦服務(wù)可以借鑒傳統(tǒng)電子商務(wù)領(lǐng)域中的Web個(gè)性化信息推薦服務(wù)。但是,具有和現(xiàn)代電子商務(wù)領(lǐng)域中個(gè)性化推薦系統(tǒng)相似功能的搜索引擎卻很少受到人們的注意。也就是說,現(xiàn)代搜索引擎尚不能廣泛地提供個(gè)性化搜索結(jié)果,對(duì)不同用戶的一個(gè)相同查詢的搜索結(jié)果總是相同的,它與提交查詢的用戶無關(guān)。因此,由于在檢索階段忽略了用戶的個(gè)性化需求特征,所以對(duì)特定用戶而言,搜索引擎經(jīng)常返回大量的無用信息。造成這種現(xiàn)象的主要原因在于現(xiàn)代搜索引擎面臨一些和傳統(tǒng)個(gè)性化信息推薦系統(tǒng)相似的問題,具體如下。
首先,用戶需求難以有效表達(dá)。這主要有兩個(gè)原因:一方面,由于一般非專業(yè)用戶都缺乏需求表達(dá)的訓(xùn)練,所以不能有效理解和表達(dá)自己的信息需求,產(chǎn)生的后果就是用戶的主觀理解往往就并不明確。形象地說,這種現(xiàn)象就是“用戶無法描述他要找什么,除非讓他看到想找的東西”。另一方面,這也來自于系統(tǒng)無法正確地獲取相關(guān)用戶個(gè)性化信息,這主要是由于網(wǎng)絡(luò)信息檢索系統(tǒng)中通常不具有主動(dòng)獲取用戶個(gè)性化特征的功能,同時(shí)也沒有要求用戶必須提交個(gè)性化信息才能使用的限制。上述兩個(gè)方面的最終效果都會(huì)產(chǎn)生系統(tǒng)無法有效獲取用戶個(gè)性化特征信息的現(xiàn)象。
其次,檢索結(jié)果準(zhǔn)確化和檢索快速化之間存在矛盾。在處理搜索引擎的海量數(shù)據(jù)時(shí),很多傳統(tǒng)的個(gè)性化推薦技術(shù)通常會(huì)產(chǎn)生嚴(yán)重的性能問題,這些主要適用于傳統(tǒng)小型商務(wù)網(wǎng)站中的個(gè)性化算法和技術(shù)往往缺乏良好的縮放性。當(dāng)然,人們也提出了一些解決方法,如維數(shù)約減、聚類分析和貝葉斯網(wǎng)絡(luò)等,雖然在一定程度上能夠解決縮放性問題,然而這些技術(shù)往往是通過在離線階段抽取出原始數(shù)據(jù)中的模式信息,并于在線階段使用這些模式來得到推薦集合,所以這些方法雖然可以減少在線的處理開銷,但是常常產(chǎn)生推薦結(jié)果不準(zhǔn)確的情況,同時(shí)在線計(jì)算的復(fù)雜度也會(huì)隨著模式的增多而增加。
最后,現(xiàn)代搜索引擎的檢索智能化水平仍然較低。由于搜索引擎無法真正理解網(wǎng)頁內(nèi)容的語義,所以單純地利用詞語匹配和統(tǒng)計(jì)分析方法,在一定程度上會(huì)造成不可避免的理解錯(cuò)誤。應(yīng)該說,即使是能夠使用某些智能語義分析功能,也由于處理時(shí)間和空間的耗費(fèi)驚人,所以在商用搜索引擎系統(tǒng)中尚不能廣泛普及。