搜(sou)(sou)尋引(yin)擎*化(hua)(又稱搜(sou)(sou)索(suo)(suo)(suo)(suo)引(yin)擎優(you)化(hua), 其英(ying)文叫 Search Engine Optimization,簡稱SEO)是(shi)一種(zhong)利(li)用(yong)搜(sou)(sou)索(suo)(suo)(suo)(suo)引(yin)擎的(de)(de)(de)(de)搜(sou)(sou)索(suo)(suo)(suo)(suo)規則來提高目(mu)的(de)(de)(de)(de)網(wang)站(zhan)在有關(guan)搜(sou)(sou)索(suo)(suo)(suo)(suo)引(yin)擎內的(de)(de)(de)(de)提名的(de)(de)(de)(de)方式。由(you)于(yu)不少研(yan)究發(fa)現,搜(sou)(sou)索(suo)(suo)(suo)(suo)引(yin)擎的(de)(de)(de)(de)用(yong)戶(hu)往(wang)往(wang)只會(hui)留意搜(sou)(sou)索(suo)(suo)(suo)(suo)結果(guo)最開首的(de)(de)(de)(de)幾(ji)項條目(mu),所以不少網(wang)站(zhan)都(dou)希望透過各種(zhong)形式來影響搜(sou)(sou)索(suo)(suo)(suo)(suo)引(yin)擊(ji)的(de)(de)(de)(de)排序。當中(zhong)尤以各種(zhong)依靠廣告維(wei)生的(de)(de)(de)(de)網(wang)站(zhan)為甚。
所謂“針對搜尋引擎作*化的處理”,是指為了要讓網站更容易被搜尋引擎接受。搜尋引擎會將網站彼此間的內容做一些相關性的資料比對,然后再由瀏覽器將這些內容以最快速且接近最完整的方式,呈現給搜尋者。
搜索引擎優化對于任何一家網站來說,要想在網站推廣中取得成功,搜索引擎優化都是至為關鍵的一項任務。同時,隨著搜索引擎不斷變換它們的排名算法規則,每次算法上的改變都會讓一些排名很好的網站在一夜之間名落孫山,而失去排名的直接后果就是失去了網站固有的可觀訪問量。所以每次搜索引擎算法的改變都會在網站之中引起不小的騷動和焦慮。可以說,搜索引擎優化是一個愈來愈復雜的任務。
早期搜尋引擎
網站管理員以及網絡內容提供者在90年代中期開始使用搜尋引擎來優化網站。此時第一代搜尋引擎開始對因特網分門別類。一開始,所有網站員得做的事只有提交所屬網站到各家搜尋引擎。這些引擎跑一些蜘蛛機器人(spider)──擷取于網頁程式中找到連至其他網頁的連結──并且儲存所找到的資料。過程中同時包含了將網頁下載并儲存至搜尋引擎擁有者的服務器中,這時有另外一個軟件稱為Indexer來擷取頁面中不同的資訊頁面中的文字、文字的位置、文字的重要性以及頁面所包含的任何連結,之后將頁面置入清單中等待過些時日后,再來擷取一次。隨著線上文件數目日積月累,越來越多網站員意識到基本搜尋 (organic search,亦翻為隨機搜尋[1]) 條目的重要性,所以較普及的搜尋引擎公司開始整理他們的列表,以顯示根據最洽當適合的網頁為優先。搜尋引擎與網站員的戰爭就此開始,并延續至今。
一開始搜尋引擎是被網站管理員本身牽著走的。早期版本的搜尋算法有賴于網站員提供資訊,如關鍵字的基本定義標簽(meta tag)。當某些網站員開始濫用標簽,造成該網頁排名與連結無關時,搜尋引擎開始舍棄標簽并發展更復雜的排名算法。由于數繁不及備載,僅列舉數個分析目標如下:
在標題簽里的文字,如:引擎 域名,如:Wikipedia.org 統一資源定位符下屬的目錄與檔名,如://Blog.Myspace.cn******** 關鍵字密度 關鍵字接近度,如:'軟盤、軟碟' '硬盤、硬盤' 圖形連結的Alt屬性,如: 由于這些都還在網站員的眼皮下打滾,搜尋引擎陸陸續續碰到諸多濫用與操縱排名等難題。為了要提供較好的結果給使用者,搜尋引擎必須調適到讓他們的搜索結果表現出最適當的結果,而非某些不道德的網絡員產生的、只有塞滿關鍵字的無用網頁。由此,新種類的搜尋引擎應運而生。
當代搜尋引擎
Google 由兩名在斯坦福大學的博士生佩吉 (Larry Page) 和布林 (Sergey Brin) 開始。他們帶來了一個給網頁評估的新概念。這個概念, 稱網頁級別 (PageRank), 是從Google 算法[2]重要的開端 。網頁級別十分倚賴導入鏈結 (incoming link) ,并利用這種每個導入某網頁的鏈結相當于給該網頁價值投一票的理論建立起邏輯系統。越多導入鏈結意味著該網頁越有“價值”。而每個導入鏈結本身價值直接根據該鏈結從何而來的網頁級別,以及相反的該頁導出鏈結 (Outgoing link) 。
在網頁級別幫助下,Google 在服務相關的結果上證明它相當優異。Google 成為了最普遍和最成功的搜索引擎。由于網頁級別度量了站點外因子, Google 感到它會比頁內因子難以動手腳。
然而道高一尺魔高一丈。網站員們已經開發出對付Inktomi 搜索引擎的鏈結操作工具和計劃。這些方法證明對Google 算法一樣管用。許多站集中于交換、買賣大量鏈接。隨著‘網站員尋求獲取鏈結只單單要影響Google送更多流量給該站,而不管是否對站點訪客有用否’這種行為增加,網頁級別對原始算法的信賴度漸漸被破壞了。
此時,是Google 和其它查尋引擎對廣大范圍的站外因子仔細檢視的時候。開發更加聰明的算法有其他原因。因特網已經膨脹到擁有非技術的廣大族群。他們經常無法使用先進的提問技術來取得資訊;而且他們得面對比起發展早期更龐大資料、更復雜的索引。搜尋引擎必須開發具備預測性、語義性、語言性和啟發性算法。
目前,網頁級別的縮小版仍然被顯示在Google 工具條上,不過網頁級別只不過是Google考慮在網頁分級時超過100個因素里中的一個。
今天,大多數搜尋引擎對它們的如何評等的算法保持秘密。搜索引擎也許使用上百因素在排列目錄;每個因素本身和因素所占比重可能不斷的在改變。
大部分當代搜尋引擎優化的思路──哪些有效、哪些沒效──這些很大部分在于觀察與根據內線消息來的猜測。某些優化員得執行控制下的實驗以取得不同優化方法的結果。
盡管如此,以下是搜尋引擎發展它們算法時的一些考慮,另,這份Google 專利清單[3]也許讀者可猜出他們會走哪條路線:
站點的年齡 自該網域注冊后過多久 內容的年齡 新內容增加的規律性 鏈接的年齡,連接站點的名譽和其相關程度 一般站內因素 負面站內因素 (例如,太多關鍵字匯標(meta tag),很顯然被優化過,會對站點造成傷害) 內容的獨特性 使用于內容的相關術語 (搜尋引擎關聯到的術語的方式視同如何關聯到網頁的主要內容) Google網頁級別 (只被使用在Google 的算法) 外在鏈接、外部鏈接的鏈結文字、在那些和在站點/網頁包含的那些鏈接 引證和研究來源(表明內容是研究性質) 在搜索引擎數據庫里列舉的詞根與其相關的術語(如 Finance/Financing) 導入的逆向鏈結,以及該鏈結的文字 一些導入鏈結的負面計分 (或許那些來自低價值頁、被交換的逆向鏈結等) 逆向鏈結取得速率:太多太快意味著“不自然”的鏈結購買活動 圍繞在導出鏈結、導入的逆向鏈結周圍的文字。例如一個鏈結如果被 "Sponsored Links" (贊助商連結)包圍,該鏈結可能會被忽略。 用 "rel=nofollow" 建議搜尋引擎忽略該鏈接 在站點該文件的結構深度 從其他資源收集的網格表,譬如監視當搜尋結果導引用戶到某頁后,用戶有多頻繁按瀏覽器的返回鈕 從來源像:Google AdWords/AdSense、Google 工具條等程序收集的網格表 從第三方資料分享協議收集的網格資料 (譬如監測站點流量的統計程式提供商) 刪除導入鏈結的速率 使用子網域、在子網使用關鍵字和內容質量等等,以及從這些活動來的負面計分 和主文件語意上的連結 文件增加或改動的速率 主機服務商 IP 和該 IP 旗下其它站點的數量/質量
其他鏈結站會員 (link farm / link affiliation) 與被鏈結的站 (他們分享IP嗎? 有一個共同的郵遞地址在"聯絡我們 (Contact Us)" 頁嗎?) 技術細節像利用301重定向被移除的網頁、對不存在網頁顯示404服務器標頭而非200服務器標頭、適當的利用 robots.txt 主機服務商正常運行時間 是否站點對不同類的用戶顯示不同的內容 (掩飾 (cloaking)) 未及時矯正、無效的導出的鏈結 不安全或非法內容 HTML代碼品質,以及錯誤出現數 由搜尋引擎自他們搜尋結果觀察到的實際點擊通過率評等 由最常存取搜尋結果的人手動評等
搜尋引擎優化和搜尋引擎之間關系
在第一代搜尋引擎發表后,搜尋引擎操作員變得對搜尋引擎優化社區感興趣。在一些早期搜尋引擎, 譬如INFOSEEK, 要得到第一名不過是把*的網頁代碼抓下、放在您的網站、并提交個URL讓搜尋引擎立即索引并排名該頁這么簡單。
由于搜尋本身的高價值和標定性,搜尋引擎和搜尋引擎優化員間自始便存在對抗的關系。最近一次于2005 年召開的AirWeb年會,旨在談論縮小這種敵對關系差距,和如何最小化某些太過于侵略性優化造成的損壞效果。
某些更具侵略性的優化員產生自動化的站點,或者使用某些最終會讓該網域被搜尋引擎掃地出門的技術。而大多數優化公司則銷售長期、低風險的策略服務,而且大部分使用高風險戰略的優化公司,則在他們旗下的會員點使用、產生商業線索、或者純內容站點,而非讓它們客戶站親身涉險。
這里提供一個使用侵略性優化技術的優化公司讓他們客戶被取締的案例。華爾街時報描述了某個使用高風險技術和涉嫌沒有透露客戶得承擔那些風險的公司[4]。Wired報告了該公司起訴某部落格,因為提及該公司被取締[5]。Google 的克特斯 (Matt Cutts) 稍后確認Google 確實取締了Traffic Power以其他們的客戶群[6]。
某些搜尋引擎對搜尋引擎優化產業提供了援助,而且是常常是優化會議和研討會的贊助商和來訪貴賓。實際上,自從付費收錄 (paid inclusion) 降臨,一些搜尋引擎現在在網站優化社區的健康有了既得利益。所有主要搜尋引擎都提供資訊/指南以協助站點優化: Google[7] 、Yahoo [8], 和MSN[9]。Google提供了Sitemaps 程序[10]幫助網站員學習如果Google 有任何問題檢索他們的網站時該如何做,并且提供Google流量與您網站關系間無價的豐富資料。雅虎的SiteExplorer[11],旨在提供一個免費方式遞交您的URL, 該方法能讓你決定打算讓雅虎索引多少頁、索引多深。雅虎的Ambassador Program[12] 與Google的Advertising Professionals[13] 提供專家級的認證。
轉載://citymember.cn/zixun_detail/3546.html