SEO技巧,爬蟲(chóng)及網(wǎng)頁(yè)文本

奈薇建站網(wǎng)	于2009-10-18 21:21發(fā)表
閱讀次數(shù)	3202次

　　鏈接結(jié)構(gòu)和爬蟲(chóng)爬行范圍

　　如果希望網(wǎng)站能夠吸引新的訪(fǎng)問(wèn)者，在網(wǎng)站設(shè)計(jì)過(guò)程中，網(wǎng)站設(shè)計(jì)者們應(yīng)考慮商業(yè)引擎網(wǎng)絡(luò)爬蟲(chóng)的工作原理。關(guān)于商業(yè)引擎網(wǎng)絡(luò)爬蟲(chóng)工作原理的具體細(xì)節(jié)，外人知道得很少，但可以從其一般工作原理中獲得幾點(diǎn)啟示。

　　網(wǎng)絡(luò)爬蟲(chóng)是沿著從網(wǎng)頁(yè)文本中提取出來(lái)的鏈接爬行的，任何一個(gè)網(wǎng)站都應(yīng)含有足夠的鏈接，以便爬蟲(chóng)能夠發(fā)現(xiàn)該站點(diǎn)所有的網(wǎng)頁(yè)。更具體的講，爬蟲(chóng)很可能從網(wǎng)站的首頁(yè)開(kāi)始爬行，因此，網(wǎng)站首頁(yè)上的鏈接應(yīng)能夠指向該網(wǎng)站所有的網(wǎng)頁(yè)。另外，這些鏈接必須包含在網(wǎng)頁(yè)的HTML中，且是標(biāo)準(zhǔn)的HTML(如，使用錨點(diǎn)標(biāo)簽)，因?yàn)榕老x(chóng)可能識(shí)別不了其他格式的鏈接，包括JAVA或JavaScript格式。

　　許多網(wǎng)站從未被任何搜索引擎發(fā)現(xiàn)過(guò)，網(wǎng)站設(shè)計(jì)者們應(yīng)該確保他們的網(wǎng)站能夠讓搜索引擎的“爬蟲(chóng)”發(fā)現(xiàn)。某些搜索引擎有URL提交功能，即允許設(shè)計(jì)者們將其網(wǎng)站的URL提交到爬行列表中，所有的主流搜索引擎都有這一功能；有些搜索引擎雖沒(méi)有此功能，但如果已經(jīng)被索引過(guò)的網(wǎng)站中有指向未被索引到的網(wǎng)站的鏈接，那么順著鏈接，爬蟲(chóng)也能爬取該網(wǎng)站。因此，對(duì)于新網(wǎng)站而言，應(yīng)該確保至少有一個(gè)已經(jīng)被主流搜索引擎索引到的網(wǎng)站鏈接到該網(wǎng)站。

　　搜索引擎程序如何解析網(wǎng)頁(yè)文本

　　一個(gè)網(wǎng)頁(yè)中的文本對(duì)搜索引擎來(lái)說(shuō)，比對(duì)用戶(hù)更為重要。網(wǎng)頁(yè)中的文本與鏈接主題無(wú)關(guān)，但可以給出一些網(wǎng)站的總體印象，這些網(wǎng)站里有些內(nèi)容不愿被搜索引擎索引到，所以，在設(shè)計(jì)時(shí)專(zhuān)門(mén)提防著搜索引擎。此時(shí)，需要區(qū)分“爬行”和“索引”這兩個(gè)概念。爬行一個(gè)網(wǎng)站是指沿著鏈接訪(fǎng)問(wèn)該站點(diǎn)上所有的頁(yè)面，且一般會(huì)為這些網(wǎng)頁(yè)保存一個(gè)復(fù)本。索引則是爬行的下一個(gè)階段，即將網(wǎng)頁(yè)文本存人到一個(gè)特殊的“倒排文檔”數(shù)據(jù)庫(kù)中，利用“倒排文檔”數(shù)據(jù)庫(kù)，可以快速搜索到與用戶(hù)查詢(xún)相匹配的頁(yè)面。標(biāo)準(zhǔn)搜索引擎一般只索引網(wǎng)頁(yè)文本，而忽略圖片和其他多媒體信息。因此，討論搜索時(shí)就應(yīng)該區(qū)分文本和圖片。

　　用戶(hù)在訪(fǎng)問(wèn)網(wǎng)站的時(shí)候，從圖片中獲得的信息比從文本中獲得的信息更直觀。舉一個(gè)極端的例子，一個(gè)來(lái)自知名公司的圖標(biāo)放在頁(yè)面中顯眼的位置，就足以說(shuō)明該網(wǎng)頁(yè)是該公司的。相反，搜索引擎則是忽略所有圖片的，至少在從網(wǎng)頁(yè)中提取信息時(shí)是這樣的。如果一個(gè)網(wǎng)頁(yè)上都是鞋子的圖片，但其文本中卻沒(méi)有一個(gè)“鞋”字，那么，搜索引擎不知道這個(gè)頁(yè)面是關(guān)于鞋子的。這就說(shuō)明，網(wǎng)站的設(shè)計(jì)者們需要確保頁(yè)面中含有描述該站點(diǎn)主題內(nèi)容的詞語(yǔ)。

　　一些更聰明的方法可以用來(lái)幫助搜索引擎來(lái)判定該頁(yè)面是關(guān)于鞋子的。Google首先提出了這樣的方法：如果有其他頁(yè)面鏈接到含有鞋子圖片的頁(yè)面，且錨文本中也提到鞋子，這便證明該圖片頁(yè)面是和鞋子相關(guān)的。另外，有一些精細(xì)的方法，如潛在語(yǔ)義分析，可以根據(jù)主題同義詞，或其他與主題相關(guān)的詞來(lái)猜測(cè)一個(gè)網(wǎng)頁(yè)的主題。例如，如果一個(gè)頁(yè)面中含有“靴子”，或其他與鞋子相關(guān)的詞(如“鞋帶”和“鞋底”)；那么，這便足以說(shuō)明該頁(yè)面是和鞋子相關(guān)的。然而，網(wǎng)絡(luò)設(shè)計(jì)者們不能依賴(lài)使用這些先進(jìn)技術(shù)的搜索引擎，因此，應(yīng)該保證他們站點(diǎn)的關(guān)鍵頁(yè)面中含有大量與主題相關(guān)的文本信息，可以吸引訪(fǎng)問(wèn)者。當(dāng)然，這些文本應(yīng)該在站點(diǎn)頁(yè)面的HTML中，而不是在圖片，或Java程序或多媒體形式的媒介中。

　　知道搜索引擎處理網(wǎng)頁(yè)的過(guò)程，有益于了解它們是如何尋找相關(guān)網(wǎng)頁(yè)的。似乎所有的商業(yè)搜索引擎都采用了向量空間模型，或是它的變體，向量空間模型一般是與其他技術(shù)結(jié)合在一起使用的。向量空間模型將所有的網(wǎng)頁(yè)都轉(zhuǎn)換到一個(gè)無(wú)序的詞庫(kù)中，每個(gè)頁(yè)面都用一個(gè)列表表示，列表中是頁(yè)面里各個(gè)詞出現(xiàn)的頻率。稍后，會(huì)用數(shù)學(xué)公式將詞頻轉(zhuǎn)換為權(quán)重，該數(shù)學(xué)公式能夠賦予文檔中詞頻較高的詞語(yǔ)較高的權(quán)重。同時(shí)，也會(huì)給稀有詞語(yǔ)賦予較高的權(quán)重。

SEO技巧,爬蟲(chóng)及網(wǎng)頁(yè)文本相關(guān)標(biāo)簽：網(wǎng)站推廣，網(wǎng)站推廣，網(wǎng)站建設(shè)，網(wǎng)站建設(shè)公司

相關(guān)熱點(diǎn)推薦

	網(wǎng)站建設(shè)中企業(yè)所面臨的
	青島企業(yè)網(wǎng)站建設(shè)
	快照又回到以前的了，是
	40種網(wǎng)站設(shè)計(jì)常用技巧
	History.bac
	建立網(wǎng)站的好處
	怎樣衡量網(wǎng)站用戶(hù)的價(jià)值
	建站要向你熟悉的行業(yè)前
	《設(shè)計(jì)師談網(wǎng)頁(yè)設(shè)計(jì)思維
	網(wǎng)站形成視覺(jué)沖擊的幾種
	網(wǎng)站：首頁(yè)所應(yīng)該達(dá)到的
	一家公司的網(wǎng)站應(yīng)該有哪
	怎樣交換友情鏈接
	企業(yè)建站系統(tǒng)
	化妝品的網(wǎng)站策劃分析
	網(wǎng)站設(shè)計(jì)的思考網(wǎng)頁(yè)版面
	SEO技巧,爬蟲(chóng)及網(wǎng)頁(yè)
	靈感創(chuàng)意的八種簡(jiǎn)潔網(wǎng)頁(yè)
	網(wǎng)站優(yōu)化站內(nèi)很重要
	微信紅包里的錢(qián)“去哪了
	網(wǎng)站優(yōu)化目標(biāo)及意義
	外部鏈接的優(yōu)化之一
	黃島網(wǎng)站建設(shè)
	nev.cn奈薇網(wǎng)站開(kāi)
	企業(yè)建站關(guān)鍵注意事項(xiàng)
	網(wǎng)頁(yè)界面設(shè)計(jì)教程六：版
	網(wǎng)站設(shè)計(jì)的方塊元素該如
	網(wǎng)站設(shè)計(jì)和圖形用戶(hù)界面
	人機(jī)交互界面設(shè)計(jì)的三個(gè)
	最接近真機(jī)的iPhon
	如何進(jìn)行網(wǎng)站首頁(yè)改版
	網(wǎng)站建設(shè)過(guò)程中對(duì)優(yōu)化的
	CSS經(jīng)典技巧十則
	企業(yè)如何建站
	什么樣的網(wǎng)站才能實(shí)現(xiàn)效
	青島網(wǎng)站制作公司哪家好
	網(wǎng)站布局有講究
	細(xì)節(jié)處理讓網(wǎng)頁(yè)設(shè)計(jì)與眾
	中國(guó)互聯(lián)網(wǎng)科技處于全球
	網(wǎng)站導(dǎo)航理論與實(shí)踐

奈薇建站網(wǎng)青島網(wǎng)站建設(shè)公司/青島網(wǎng)站制作公司，專(zhuān)業(yè)提供"氣質(zhì)"型網(wǎng)站建設(shè)及精美網(wǎng)站制作服務(wù)，同時(shí)歡迎各地網(wǎng)站建設(shè)公司、網(wǎng)站制作公司代理我們的奈薇建站系統(tǒng)共同發(fā)展

熱點(diǎn)地區(qū)：青島網(wǎng)站建設(shè)價(jià)格青島即墨網(wǎng)站制作公司開(kāi)發(fā)區(qū)信息港山東在線(xiàn)門(mén)戶(hù)

業(yè)務(wù)流程

交費(fèi)流程
網(wǎng)站建設(shè)流程
定制開(kāi)發(fā)流程
免費(fèi)網(wǎng)站審核流程

支付方式

在線(xiàn)支付（推薦）
銀行匯款/ATM機(jī)轉(zhuǎn)賬
企微代收

快速鏈接

網(wǎng)站建設(shè)案例
YPS行業(yè)門(mén)戶(hù)系統(tǒng)
站長(zhǎng)后臺(tái)管理
站內(nèi)活動(dòng)與新聞

常見(jiàn)問(wèn)題

交費(fèi)常見(jiàn)問(wèn)題
做網(wǎng)站需要多少錢(qián)？
怎樣讓百度收錄網(wǎng)站？
新手站長(zhǎng)建站必讀

服務(wù)與支持

公司介紹
聯(lián)系我們
誠(chéng)聘英才
媒體報(bào)道

魯ICP備13010283號(hào)

建站咨詢(xún)熱線(xiàn)：0532-88781131　15166683288　18562723728
版權(quán)所有© BangJianZhan.Com & Nev.Cn 青島網(wǎng)站建設(shè)/網(wǎng)站制作公司
青島雨后網(wǎng)絡(luò)科技有限公司 - 青島市市北區(qū)福州北路90號(hào),景泰尚都6層

已經(jīng)為您服務(wù)了

21年 1個(gè)月 29天

亚洲欧美日本VA在线播放,百合互慰无码免费视频在线观看 ,风韵丰满熟妇啪啪区老熟熟女,国产精品久久久久久无毒不卡

SEO技巧,爬蟲(chóng)及網(wǎng)頁(yè)文本