服務(wù)熱線
153 8323 9821
目前中文網(wǎng)站在整個(gè)互聯(lián)網(wǎng)中的影響還比較小,這主要是由于中文網(wǎng)站總體的水平(技術(shù)上,內(nèi)容上)都還相對(duì)落后造成的,最主要的表現(xiàn)有:
行業(yè)知識(shí):不知道搜索引擎對(duì)吸引的新用戶的重要性,在搜索引擎排名服務(wù)中追求“傻瓜相關(guān)”,購(gòu)買(mǎi)一些其實(shí)沒(méi)有太多實(shí)際意義的行業(yè)關(guān)鍵詞。其實(shí)能夠用戶輸入的關(guān)鍵詞越多,真對(duì)性越強(qiáng),價(jià)值越高。如果用戶能夠直接定位到產(chǎn)品具體內(nèi)容頁(yè)比到網(wǎng)站首頁(yè)有價(jià)值的多;
發(fā)布技術(shù):網(wǎng)站的網(wǎng)頁(yè)進(jìn)入Google的索引量非常小,動(dòng)態(tài)網(wǎng)頁(yè)仍是主要發(fā)布機(jī)制,缺乏將動(dòng)態(tài)頁(yè)面鏈接表現(xiàn)成靜態(tài)頁(yè)面的機(jī)制;
頁(yè)面設(shè)計(jì):頁(yè)面標(biāo)題重復(fù),關(guān)鍵詞不突出,過(guò)渡使用JavaScript腳本/圖片/Flash等不適合搜索引擎索引的非文本形式;
無(wú)法量化的東西是不可管理的,以上根本的原因往往是網(wǎng)站自身缺乏日志統(tǒng)計(jì)分析造成:
其實(shí)大部分網(wǎng)站只要通過(guò)一些簡(jiǎn)單的策略還是可以讓網(wǎng)站自身的水平在互聯(lián)網(wǎng)中有一個(gè)真實(shí)的體現(xiàn),網(wǎng)站結(jié)構(gòu)設(shè)計(jì)中面向搜索引擎的優(yōu)化注意事項(xiàng)包括:
鏈接引用的重要性;
如何突出關(guān)鍵詞:網(wǎng)頁(yè)標(biāo)題、主題的設(shè)計(jì);
頁(yè)面及站點(diǎn)結(jié)構(gòu)設(shè)計(jì)注意事項(xiàng);
以及站點(diǎn)訪問(wèn)統(tǒng)計(jì)的重要性等;
Google的站點(diǎn)設(shè)計(jì)指南
(注意:本網(wǎng)站設(shè)計(jì)本身就利用了其中一些方法)。
什么是PageRank
Google 等新一帶搜索引擎的優(yōu)勢(shì)之一在于不僅索引量很大,而且還將最好的結(jié)果排在搜索結(jié)果的最前面,具體的原理可以參考Google の秘密 - PageRank 徹底解説一文,PageRank簡(jiǎn)單的說(shuō)類(lèi)似于科技論文中的引用機(jī)制:誰(shuí)的論文被引用次數(shù)多,誰(shuí)就是權(quán)威。在互聯(lián)網(wǎng)上 PageRank就是基于網(wǎng)頁(yè)中相互鏈接關(guān)系的分析得出的。
此外,從計(jì)算方法角度闡述PageRank機(jī)制還有這篇文章:http://pr.efactory.de/里面有更詳細(xì)的PageRank算法說(shuō)明和各種清晰的小型個(gè)案分析:
比如:子頁(yè)中導(dǎo)航條的重要性
B <=> A => C
Vs
B <=> A <=> C (好)
頁(yè)面數(shù)量因素:
B <=> A <=> C
Vs
F <=\ /=> G
B <=> A <=> C (好)
D <=/ \=> E
一個(gè)意想不到的結(jié)論:
(B <=> A <=> C) ( E <=> D <=> F)
Vs
(B <=> A <=> C) <=> ( E <=> D <=> F)
PageRank升高的只是被鏈接的2個(gè)首頁(yè)A和D,而網(wǎng)站子頁(yè)面的PageRank平均會(huì)略有下降。同時(shí):一個(gè)網(wǎng)站進(jìn)入Google的索引量越大其受類(lèi)似因素影響越小。
PageRank不對(duì)稱(chēng)的頁(yè)面互鏈:
Google會(huì)用BadRank之類(lèi)的算法進(jìn)行糾正,而且一個(gè)網(wǎng)頁(yè)著有來(lái)自“與其自身不相稱(chēng)”的高PageRank站點(diǎn)的鏈接,而自身又缺少足夠數(shù)量和質(zhì)量的反相鏈接的話,其PageRank會(huì)自動(dòng)降低為0,A(pr=7) <=> B(pr=0)
簡(jiǎn)單的說(shuō)就是:偶爾要被權(quán)威站點(diǎn)反相鏈接不算數(shù),要被足夠多的權(quán)威站點(diǎn)引用才能提高自身網(wǎng)頁(yè)的PageRank。
鏈接就是一切
在互聯(lián)網(wǎng)的海洋中,最重要的就是互聯(lián)互通,不被其他網(wǎng)站引用的網(wǎng)站就是“信息孤島”。“酒好也怕巷子深”,也許這話說(shuō)起來(lái)有點(diǎn)像垃圾郵件廣告,但事實(shí)就是這樣。所以如果做網(wǎng)站的目的不是孤芳自賞,就需要積極的推廣自己的網(wǎng)站。
通過(guò)搜索引擎推廣自己需要注意以下幾個(gè)方面:
以量取勝:不一定加入大型網(wǎng)站的分類(lèi)目錄才是網(wǎng)站推廣,來(lái)自其他網(wǎng)站的任何反相鏈接都是有用的
網(wǎng)站推廣比較經(jīng)典的方式就是加入比較大型門(mén)戶網(wǎng)站的分類(lèi)目錄,比如:Yahoo!,dmoz.org等。其實(shí)這里有一個(gè)誤區(qū):不一定非要加入大型網(wǎng)站的分類(lèi)目錄才是網(wǎng)站推廣,因?yàn)楝F(xiàn)在搜索引擎已經(jīng)不再只是網(wǎng)站目錄的索引,而是更全面的網(wǎng)頁(yè)索引,所以無(wú)論來(lái)自其他網(wǎng)站任何地方的反相鏈接都是非常有價(jià)值的,哪怕是出現(xiàn)在新聞報(bào)道,論壇,郵件列表歸檔中。很多大型站點(diǎn)的郵件列表發(fā)郵件時(shí),一定注意在自己的簽名中加上自己網(wǎng)站的地址。
Blogger(Weblog的簡(jiǎn)稱(chēng))們也許最深刻地理解了“鏈接就是一切”這句話的含義,由于Blog的內(nèi)容之間有大量的相互鏈接,因此最經(jīng)常被引用的 Blog頁(yè)面在搜索引擎中的排名往往比一些大型商業(yè)網(wǎng)站的頁(yè)面還要高。
以質(zhì)取勝:被PageRank高的網(wǎng)站引用能更快地提高PageRank
數(shù)量只是關(guān)鍵因素之一,來(lái)自PageRank高的頁(yè)面的鏈接還能更快的提高被鏈接目標(biāo)的PageRank,我只是將一些文章投稿在了ZDNet中國(guó)上,由于頁(yè)面上有文章出處鏈接,相應(yīng)網(wǎng)頁(yè)和網(wǎng)站整體的PageRank過(guò)了一段時(shí)間后就有了很大的提升。有時(shí)候被什么樣的網(wǎng)站引用有時(shí)候比引用次數(shù)多更重要。這里我要特別感謝的是,當(dāng)時(shí)ZDNet中國(guó)是唯一遵循了我的版權(quán)聲明的要求表明了文章出處,并且有反相鏈接的網(wǎng)站。
按照這個(gè)原則:能夠名列Yahoo!和DMOZ這樣的大型權(quán)威目錄的頭2層是非常有價(jià)值的。
了解搜索引擎的"價(jià)值觀":
Lucene 簡(jiǎn)介這篇文章被Jakarta.apache.org的lucene項(xiàng)目引用以后,這篇文章就成為了所有頁(yè)面中PageRank最高的頁(yè)面,而 Google支持的一些項(xiàng)目,比如:Folding@Home,讓我一直懷疑他們對(duì)政府,教育和非盈利組織的站點(diǎn)有特別加分,畢竟.org .edu才代表了互聯(lián)網(wǎng)的實(shí)質(zhì):分權(quán)和共享。
但更合理的解釋是:.org很多都是開(kāi)放技術(shù)平臺(tái)的開(kāi)發(fā)者,他們會(huì)在首頁(yè)這樣的地方加入 Powered By Apache, Power by FreeBSD之類(lèi)的鏈接表示對(duì)其他開(kāi)源平臺(tái)的尊重,所以象Apache, PHP, FreeBSD這樣的開(kāi)源站點(diǎn)在GOOGLE中都有非常高的PageRank。而在.edu這些站點(diǎn)中,很多都是學(xué)術(shù)性比較強(qiáng)的文檔,以超鏈接形式標(biāo)明參考文獻(xiàn)的出處已經(jīng)成為一種習(xí)慣,而這也無(wú)疑正是PageRank最好的依據(jù)。
注意:不要通過(guò)Link Farm提高自身的站點(diǎn)排名:Google會(huì)懲罰那些主動(dòng)鏈接到Link Farm站點(diǎn)以提高自身排名站點(diǎn),相應(yīng)站點(diǎn)的頁(yè)面將不會(huì)被收入到索引中。但如果你的頁(yè)面被別的Link Farm鏈接了也不必?fù)?dān)心,因?yàn)檫@種被動(dòng)的鏈接是不會(huì)被懲罰的。
不要吝嗇給其他網(wǎng)站的鏈接:如果一個(gè)網(wǎng)頁(yè)只有大量的進(jìn)入鏈接,而缺乏導(dǎo)出鏈接,也會(huì)被搜索引擎認(rèn)為是沒(méi)有價(jià)值的站點(diǎn)。保證你的網(wǎng)站能夠幫助搜索引擎更準(zhǔn)確地判斷哪些是對(duì)用戶最有價(jià)值的信息,也就是說(shuō)如果你的網(wǎng)站只有外部反向鏈接而沒(méi)有導(dǎo)出鏈接的話,也會(huì)對(duì)你的網(wǎng)站在搜索結(jié)果中的表現(xiàn)帶來(lái)負(fù)面影響。當(dāng)然網(wǎng)站中連一個(gè)導(dǎo)出鏈接都沒(méi)有的情況非常罕見(jiàn),除非你是刻意這么做。正常情況下大家都會(huì)自然地在網(wǎng)頁(yè)中加上一些其他網(wǎng)站的鏈接,帶領(lǐng)訪問(wèn)者去到我們認(rèn)為重要或能夠提供更多有價(jià)值信息的地方,
另外在推廣自己網(wǎng)站之前也許首先需要了解自己網(wǎng)站目前在一些搜索引擎中的知名度,原理非常簡(jiǎn)單,可以參考如何評(píng)價(jià)網(wǎng)站的人氣一文。
網(wǎng)站推廣只是手段,如何突出內(nèi)容、讓需要相關(guān)信息的用戶能夠盡快的找到你的網(wǎng)站才是目的,PageRank高并不代表像Yahoo!這樣的門(mén)戶站點(diǎn)就能在所有搜索結(jié)果中排名靠前,因?yàn)樗阉饕娴慕Y(jié)果是搜索關(guān)鍵詞在頁(yè)面中的匹配度和頁(yè)面的PageRank相結(jié)合的排名結(jié)果。因此第二個(gè)要點(diǎn):如何突出關(guān)鍵詞。
如何突出關(guān)鍵詞:面向主題(Theme)的關(guān)鍵詞匹配
Theme Engine正在逐步超過(guò)PR,成為結(jié)果排序中更主要的因素,可以比較一下以下現(xiàn)象:
為什么查“新聞”,“汽車(chē)”之類(lèi)的文字,各種門(mén)戶網(wǎng)站的首頁(yè)不在第一位?要知道他們的頁(yè)面中都有相應(yīng)頻道的鏈接文字的
一篇新聞頁(yè)面中,搜索引擎如何不通過(guò)模板匹配,自動(dòng)將新聞的主體和頁(yè)面中的頁(yè)頭,欄目導(dǎo)航條,頁(yè)尾等部分的內(nèi)容區(qū)分開(kāi)的?
其實(shí)以上問(wèn)題都可以歸結(jié)為網(wǎng)頁(yè)內(nèi)容摘要的提取策略和關(guān)鍵詞在其中的命中:
首先將能夠描述一個(gè)頁(yè)面內(nèi)容的分成以下幾種類(lèi)型:
鏈入文字描述:inbound link text
http://www.google1.net/google/ww ... -inbound-link.shtml
HTML頁(yè)面標(biāo)題:title 好標(biāo)題一般會(huì)將頁(yè)面中最重要的關(guān)鍵詞放在最前面,比如:ABC-10型吸塵器 - XX家電城
HTML內(nèi)容主體:content text
鏈出文字:outbound link text
如果按照以下規(guī)則:
一個(gè)頁(yè)面中關(guān)鍵詞命中權(quán)重:鏈入文字 > HTML標(biāo)題文字 > HTML頁(yè)面主體內(nèi)容 » 出鏈文字,以上現(xiàn)象就比較好解釋了。
鏈入文字是頁(yè)面上看不見(jiàn)的,但鏈入文字對(duì)被鏈接頁(yè)面有巨大的作用:在現(xiàn)代搜索引擎在關(guān)鍵詞匹配的過(guò)程中,匹配的過(guò)程不只看當(dāng)前頁(yè)面的內(nèi)容摘要:很大程度上,不只看這個(gè)網(wǎng)頁(yè)自己說(shuō)自己有什么內(nèi)容,還要看別人如何鏈接時(shí),如何描述你的網(wǎng)站別人怎么稱(chēng)呼你,比你自己說(shuō)自己更重要。。
比如查:“世界衛(wèi)生組織”,返回結(jié)果中有
http://www.google1.net/google/www.who.int/index.htm 而這個(gè)頁(yè)面中是沒(méi)有中文的,之所以能匹配上,是因?yàn)楹芏噫溄铀闹形木W(wǎng)站使用了:<a href="世界衛(wèi)生組織,所以,這個(gè)頁(yè)面中不存在的中文關(guān)鍵詞也成為了頁(yè)面摘要的一部分'>http://www.who.int/">世界衛(wèi)生組織</a>,所以,這個(gè)頁(yè)面中不存在的中文關(guān)鍵詞也成為了頁(yè)面摘要的一部分。
這樣一想,就可以知道鏈出鏈接的文字其實(shí)是為被鏈接的子頻道首頁(yè)或者內(nèi)容詳情頁(yè)服務(wù)的。對(duì)自身頁(yè)面的關(guān)鍵詞密度只有負(fù)面的影響,這也是Google建議一個(gè)頁(yè)面中鏈接不要超過(guò)100個(gè)的原因:他根本不索引100個(gè)鏈接以后的內(nèi)容。
按照以上規(guī)則,搜索引擎將一篇新聞詳情頁(yè)中的新聞內(nèi)容提取出來(lái)就是把頁(yè)面上所有帶HTTP鏈接的文字都去掉,就是新聞的內(nèi)容部分了,更精確一些可以通過(guò)取最長(zhǎng)文本段落等策略實(shí)現(xiàn);
而很多網(wǎng)站首頁(yè)或頻道首頁(yè)中幾乎全部都是鏈接,經(jīng)過(guò)搜索引擎分析的結(jié)果就是:什么內(nèi)容也沒(méi)有,能夠被命中的關(guān)鍵詞僅僅是別人鏈接你用的“網(wǎng)站首頁(yè)”和頻道標(biāo)題Title中