向搜索引擎 “推銷” Web 站點本身已經成了一種業務,許多顧問、工具和搜索引擎優化(SEO)站點都可以幫助您的站點吸引搜索引擎的注意。或許現在的信息和資源已經太多了。但是,如果您建立了一個可訪問且有用的站點,就踏上了通往成功的正確道路。如果您負責一個Web 站點 —— 無論您是寄希望于專業的搜索引擎公司,還是自己去打理它,都需要了解針對搜索引擎而優化站點的基礎知識。
這個分四部分的系列將提供開始您的 SEO 戰役所需的工具,無論您計劃的 SEO 規模有多大,都會對您有所幫助。在第 1 部分和第 2 部分中,您將學習搜索引擎的工作原理,以及如何創建對搜索引擎和用戶都有用且可訪問的內容。在這個系列的第 3 部分中,Mike Moran 和 Bill Hunt(Search Engine Marketing, Inc. 的作者)將幫助您使頁面進入搜索索引。在第 4 部分中,他們將處理大型 Web 站點特有的搜索營銷問題。
在開始學習本系列之前,您需要了解以下術語:
目錄(Directory)
目錄是由人為編輯的搜索結果。大多數目錄依靠的是人為提交而不是爬行器(spider)。
關鍵字、關鍵詞和關鍵短語(Keyword、keyterm 和 keyphrase)
關鍵字、關鍵詞和關鍵短語是 Web 站點在搜索引擎結果頁面(也稱為 SERP)上排序所依據的詞。根據站點受眾的不同,您可以選擇一個單詞、多個單詞的組合或整個短語。為簡化起見,本文將使用關鍵詞 這個術語表示所有這三種類型。
鏈接場(Link farm)
在 SEO 術語中,鏈接場是指一個充滿鏈接的頁面,這些鏈接其實沒有實際作用,它們只作為鏈接存在,而沒有任何實際的上下文。那些采用運用黑帽 SEO 方法的人利用鏈接場,在一個頁面中增加大量鏈接,希望能通過這種方式使 Google™ 誤認為這個頁面很有鏈接的價值。
自然排名(Organic listing)
自然排名是 SERP 中的免費列表。自然排名的 SEO 通常涉及改進 Web 站點的實際內容,這往往是在頁面或基礎架構級別進行的。
PageRank
PageRank 是迷戀 Google 的人們用來測試其站點在 Google 中的排名的一種度量標準。SEO 和搜索引擎營銷(SEM)專家也使用這個術語描述網頁在 SERP 中的排名以及 Google 根據排名算法給予站點的分數。無論如何定義,PageRank 都是 SEO 的重要部分。
付費排名(Paid listing)
顧名思義,付費排名就是只有在付費后才能列入搜索引擎的服務。根據搜索引擎的不同,付費排名可能意味著:為包含于索引之中、每次點擊(PPC)、贊助商鏈接(sponsored link)或者在搜索目標關鍵詞和短語時讓站點出現在 SERP 中的其他方式而付費。
排名(Ranking)
排名是頁面在目標關鍵詞的 SERP 中列出的位置。SEO 的目標是提高 Web 頁面針對目標關鍵詞的排名。
排名算法(Ranking algorithm)
排名算法是搜索引擎用來對其索引中的列表進行評估和排名的規則。排名算法決定哪些結果是與特定查詢相關的。
搜索引擎營銷(Search engine marketing,SEM)
SEM 這個術語可以與 SEO 互換使用,但 SEM 常常是指通過付費和廣告向搜索引擎推銷 Web 站點,同時應用 SEO 技術。
搜索引擎優化(Search engine optimization,SEO)
SEO 就是根據對搜索引擎的吸引力和可見性來優化內容,從而使 Web 頁面能夠被搜索引擎選中。SEO 主要用來提高有機列表的排名。我使用 SEO 這個術語描述我推薦的技術,但是其中許多技術也可以歸入 SEM 的范疇。
搜索引擎結果頁面(Search engine results page,SERP)
SERP 是為特定搜索顯示的列表或結果。SERP 有時候定義為搜索引擎結果的安排(placement)。根據本系列的目的,我將其稱為頁面而不是安排。在 SEO 領域中,在 SERP 中取得良好的表現就是一切。
垃圾技術(Spamming)
垃圾技術是一種欺詐性的 SEO 手段,它嘗試欺騙爬行器(spider),并利用排名算法中的漏洞來影響針對目標關鍵詞的排名。垃圾技術可以表現為多種形式,但是 “垃圾技術” 最簡單的定義是 Web 站點用來偽裝自己并影響排名的任何技術。根據是否采用垃圾技術,SEO 方法可分為兩大類:
- 黑帽 SEO(Black hat SEO):用垃圾技術欺騙搜索引擎。黑帽 SEO 以偽裝、欺詐和竊取的方式騙取在 SERP 中的高排名。
- 白帽 SEO(White hat SEO):以正當方式優化站點,使它更好地為用戶服務并吸引爬行器的注意。在白帽 SEO 中,能夠帶來好的用戶體驗的任何東西也都被視為對 SEO 有益。
爬行器(Spider)
爬行器在 Web 上漫游,尋找要添加進搜索引擎索引中的列表。爬行器有時也稱為 Web 爬行榜(Webcrawler)或機器人。針對有機列表優化頁面也就是為了吸引爬行器的注意。
了解了這些定義之后,您可能依然很迷惑:SEO 的目的是什么?SEO 似乎有點兒搞陰謀的味道,不是嗎?
SEO 創建可訪問和有用的 Web 站點
良好的 SEO 實踐會使站點更實用,可訪問性更強,而且對搜索引擎更友好。但是,不守規矩的 SEO 營銷企業會運用黑帽 SEO 技術(垃圾技術),這給 SEO 帶來了壞名聲。但是,任何種類的營銷都是這種情況:推銷產品的方法有好也有壞,而且有時候壞方法更有效 —— 但只是在短期內。通過黑帽 SEO 技術欺騙搜索引擎是一條危險的道路,會帶來糟糕的用戶體驗。因此本系列只關注白帽 SEO 技術。利用白帽 SEO 技術,您和您的用戶都會獲益。這是雙贏的做法。
SEO 對于商業站點至關重要
如果您的業務是在線式的,那么企業的生存就依賴于 Web 站點受關注的程度。如果人們根本無法找到某個商業站點,又怎么能夠從那里買東西呢?而且,問題不僅僅是讓潛在顧客找到您的主頁并通過站點中的下拉菜單、鏈接或其他任何東西進行導航。過去,如果您有了一個出色的主索引頁,人們就會蜂擁而至,耐心地瀏覽,直至找到自己所需的信息,但現在已經不再是這種情況了。
SEO 是 Web 使用方式演進的一部分
人們使用搜索引擎準確地找到您的站點中他們所需的那個頁面。如果您的獨立頁面沒有出現在 SERP 的頂部,潛在受眾就可能找不到您的站點。用戶更可能通過搜索查詢進入您的站點,而不是通過頁面層次結構進行導航。對于站點管理員而言,這意味著每個單獨的頁面都必須足夠健壯,可以被單獨搜索到。必須使站點適應搜索引擎爬行器,然后讓頁面對用戶有足夠的吸引力,讓用戶愿意停留在這里。白帽 SEO 正是這樣一種方法。
為了解釋 “讓頁面足夠健壯,可以被單獨搜索到” 的含義,我將以 developerWorks Web 站點為例。因為 www.ibm.com/developerworks 的主頁是所有 developerWorks 內容的入口,我們針對 “IBM resource [for] developers” 優化主頁,使其具有一般化的特點,而且使用這個短語搜索時,在 Google SERP 中這個主頁是排在第一位的結果。使用有機優化技術帶來了回報。Google 知道這個頁面與哪些內容相關,用戶點擊這個鏈接后不會失望,他們會進入一個擁有 IBM 提供的開發者資源的豐富頁面。
但是,除了主頁之外,在 developerWorks Web 站點中還有其他許多東西。一些潛在受眾可能會使用我們的導航系統或內部搜索尋找更有針對性的開發者資源,但也有許多其他用戶更傾向于使用外部搜索引擎搜索內容,并直接進入相關頁面。
例如,如果某位搜索者要查找 “linux developer tutorials”,而 URL 為 www.ibm.com/developerworks/linux 的 developerWorks Linux 頁面沒有出現在 SERP 的前 10 個結果中,那么在 developerWorks 主頁上所做的所有優化對于這位搜索者來說都是沒用的。但是,我們在 developerWorks 站點上實踐良好的有機 SEO 已經許多年了,developerWorks Linux 頁面目前是 “linux developer tutorials” 的 Google SERP 中的第一個結果。良好的 SEO 意味著優化站點上的每個頁面,讓搜索引擎準確地了解您認為每個頁面上最重要的內容。
由于要考慮優化 Web 站點上的每個頁面,以提高在搜索引擎結果中的排名,SEO 看似煩瑣。您或許想知道是否存在某種訣竅或者更簡便的方法。但是,對于提高在搜索引擎結果中的排名來說,不存在訣竅。底線就是創建能讓用戶贊賞的優秀內容,這樣搜索引擎會給予您很好的排名。在這個系列中,您將學習如何實現這個目標。
正確地實現了良好的 SEO 也就會創建出對搜索引擎友好、對用戶有吸引力的站點。有機 SEO 的收益之一是可訪問性非常高的頁面。搜索引擎爬行器查看頁面的方式與有視力障礙的人所用的頁面閱讀器相同。可以使用 lynx 瀏覽器體會一下頁面閱讀器所看到的站點是什么樣的。頁面閱讀器還會展示您的站點在小屏幕上的顯示效果,比如手機或其他小型 Web 瀏覽工具。如果能夠使頁面具有較好的可訪問性,讓頁面閱讀器能夠輕松地理解它們,那么頁面就是對搜索引擎友好的。
在 SEO 的歷史中,大多數臭名昭著的搜索引擎垃圾技術都會創建出對用戶不友好或可訪問性差的 Web 頁面。兩種對用戶友好性破壞最大的黑帽 SEO 技術是:
- 元標記垃圾技術:在早期,搜索引擎會讀取元關鍵詞、描述和其他標記。搜索引擎根據這些標記的內容判斷頁面的主題,并確定頁面在 SERP 中的排名情況。遺憾的是,某些人利用了這一點,在他們的元標記中重復地加上許多相同的單詞,讓搜索引擎誤認為頁面包含某些實際上并不存在的內容。這種做法誤導了用戶和搜索引擎。例如,如果我們希望將 Linux 用戶引導到 developerWorks 主頁上,但是這里并沒有多少 Linux 內容,那么可能會這樣做:“
meta name="keywords" content="linux, ibm, linux, developer, tutorials, ibm, developer, linux, tutorial, tutorial, tutorials, resources, linux, tutorials, developer" />
。當用戶點擊 SERP 中列出的這個站點時,將顯示 developerWorks 主頁,他們會很失望,因為這里只有零星的幾個 Linux 教程,而不是像 developerWorks Linux 部分那樣專門提供 Linux 教程。正因為有許多人采用元標記垃圾技術實現黑帽 SEO,搜索引擎不再使用元標記中的信息來對頁面進行排名了。
- alt 標記欺騙:對 alt 屬性的濫用也屬于黑帽 SEO ,因為它向用戶和搜索引擎提供關于圖片的錯誤信息。例如,developerWorks Linux 頁面上某幅圖片的 alt 標記可能填充了下面這樣的關鍵字:
img alt="linux, ibm, linux, developer, tutorials, ibm, developer, linux, tutorial, tutorial, tutorials, resources, linux, tutorials, developer" />
。盡管 Linux 頁面確實與 Linux 教程有關,但應保證這幅圖片本身確實向頁面閱讀器傳遞了關于其內容的準確信息。否則就是對 alt 標記的濫用。
最重要的是要記住,合適的文字對于搜索引擎和用戶都很重要。文字要向搜索引擎清楚且真實地表明頁面的主題,對用戶也是如此。
在想到搜索引擎時,大多數人會想到 Google,但是為了公平地對待所有搜索方法和搜索引擎,我將使用搜索引擎 這個術語。第 1 部分和第 2 部分中的信息是以 Google 為中心的,但也適用于其他大多數主流搜索引擎。根據目標受眾的不同,您的目標搜索引擎可能有所不同。因為我只描述白帽 SEO 技術,所以這里提供的工具和知識會使您的 Web 站點對美國的所有主流搜索引擎更有吸引力。美國以外地區的搜索引擎流行情況可能有所不同,但是白帽 SEO 能幫助站點在大多數基于英語的搜索引擎和其他基于爬行器的搜索引擎中獲得更好的排名。
搜索引擎的類型
目錄和真正的搜索引擎之間的差異是,目錄是人為編輯出來的,而搜索引擎是由爬行器通過跟蹤鏈接漫游 Web 而建立的。白帽 SEO 的主要關注點在于提高站點在使用爬行器編輯的搜索引擎中的排名。
搜索引擎工作原理 —— 簡化版
為了收集數據,搜索引擎讓爬行器跟蹤鏈接漫游、組織數據并判斷每個頁面上的文本與什么內容相關。當搜索者進行搜索時,搜索引擎利用爬行器收集的信息,通過專用排名算法建立與這次查詢最相關的站點列表,并顯示在 SERP 中。
目錄工作原理 —— 簡化版
純粹的目錄就像是圖書館中的分類卡,只不過是采用了電子形式。它包含編輯好的已提交到目錄中的站點列表。它知道這個列表中有什么,而且知道對于搜索字段中輸入的單詞應該搜索哪些類別。這是因為最初的提交者常常會選擇分類。另外,搜索者可能根據目錄的類別進行瀏覽,尋找帶有他所請求的單詞的站點。
Google 是真正的搜索引擎。它提供一些來自 Open Directory 或 DMOZ 的目錄結果,但是大多數結果來自爬行器的漫游和 PageRank 算法。Yahoo!® 是一種目錄混合型搜索引擎,它首先搜索自己的目錄,然后使用 Yahoo Bot Slurp! 進行搜索引擎搜索。
關于 Google 的更多信息
許多 Web 站點管理員報告說,Google 的搜索索引在他們所有與搜索相關的流量中占主要比例。正因為 Google 如此流行,您很可能希望主要針對 Google 來優化站點。
對于 Web 站點管理員來說,幸運的是,Google 之所以成為第一搜索引擎,并不是由于它采用了什么營銷手段或者對用戶不友好的其他手段,而是因為它是真正的搜索引擎,它的搜索以內容質量和鏈接質量為依據。Google 一直堅守著 “對用戶有益的東西就在 SERP 中具有高排名” 這一原則。
Google 和所有其他搜索引擎
美國大多數搜索引擎和目錄都與 Google 和 Yahoo! 有關。要想進一步了解這些關聯,請參見 參考資料 中 Bruce Clay 的 Search Engine Relationship Chart。
Google 有一個 Add URL 工具,但是站點的排名是由鏈接分析決定的;如果 Google 沒有被其他要編入索引的站點引到您的站點,那么就永遠不會給予您較高的排名,無論您是否主動提交了站點。通過 Add URL 進行提交并不意味著頁面會被自動列出,但是它能使搜索引擎注意到您的頁面。過去,SEO 專家建議使用 Add URL 工具對爬行器不易找到的頁面進行 “深度提交”。但是,現在 Google 引入了 Google Sitemaps(Google 站點地圖),用這種格式進行提交效果會更好。本系列的第 3 部分將詳細介紹 Google Sitemaps。
從長遠角度來看,在 SEO 方面的努力最好投入在優化站點以促進 Google 和其他爬行器的深度漫游上。
Google 的排名算法是一項頂級機密。關于 Google 的已知情況如下:
- Google 的主要結果來自在 Web 上漫游的爬行器。
- Google 的爬行器只查看頁面上的可見文本。
- Google 為以下類型的文件編制索引:html、pdf、ps、wk1、wk2、wk3、wk4、wk5、wki、wks、wku、lwp、mw、xls、ppt、doc、wks、wps、wdb、wri、rtf、swf、ans 和 txt。
- Google 索引的創建過程主要關注頁面內容和鏈接流行度。決定頁面在 Google 列表中的排名的部分因素包括:指向這個站點的鏈接數量、鏈接到這個站點的站點的質量、指向這個站點的鏈接中和鏈接周圍的文本以及頁面本身鏈接到的內容。
- Google 公布,其結果由超過 100 種因素決定。
- Google 使用 PageRank 檢查 Web 站點的鏈接結構,從而判斷哪些頁面是最重要的。
- Google 還會進行它所說的超文本匹配分析(hypertext-matching analysis) 來判斷哪些頁面與特定的搜索查詢相關。
基本上,Google 使用 PageRank 來評估入站鏈接(鏈接到您的站點的站點)和出站鏈接(您的站點鏈接到的站點)的質量,它會給出一個值來表示這些鏈接的數量和質量(流行度)。Google 認為的高質量站點會獲得更高的 PageRank。然后,Google 綜合使用 PageRank 排名和超文本匹配分析來尋找與搜索相關的頁面。
為了防止有人利用垃圾技術欺騙搜索引擎,Google 不斷改變它的排名算法并更新它的索引。在搜索引擎中獲得高排名的最佳方法是,優化站點,切勿依靠排名算法的漏洞來獲得高排名。與現實世界中一樣,最誠實的 SEO 就是最好的策略。
在本系列的第 2 部分中,您將了解如何研究關鍵詞并了解 “自左上角向下” 式的關鍵詞優化策略。通過第 3 部分和第 4 部分的學習,您將確定如何運用技術來贏得 SEO 戰役,包括如何使您的頁面進入搜索索引,并解決大型 Web 站點特有的搜索營銷問題。現在,卷起衣袖,動手開始優化吧!
參考資料
學習
您可以參閱本文在 developerWorks 全球站點上的 英文原文 。
Search Engine Watch:閱讀關于搜索引擎的更詳細的技術信息,并參與活躍的論壇討論。
Jill Whalen 的 High Rankings:了解關于白帽 SEO 技術的建議。
Bruce Clay 的 Search Engine Relationship Chart:更好地認識所有搜索引擎的關聯方式。這些聯系經常變化,這個圖表也會經常更新。
Jakob Nielsen 的 Alertbox 中的 The Power of Defaults(2005 年 9 月 26 日):了解搜索引擎用戶為什么會更頻繁地點擊排在第一位的 SERP 條目,這種現象往往不能用相關性排名來解釋。
Jakob Nielsen 的 Alertbox 中的 When Search Engines Become Answer Engines(2004 年 8 月 16日):了解人們如何利用搜索引擎來找到他們當時關心的問題的答案。
Jakob Nielsen 的 Alertbox 中的 Information Foraging: Why Google Makes People Leave Your Site Faster(2003 年 6 月 30 日):找到提供出色信息的站點越來越輕松了,可為什么用戶在每個 Web 站點上停留的時間縮短了?在這篇文章中您或許能找到答案。
IBM Accessibility Center:這里的大量參考資料可以幫助您學習如何構建可訪問性高的應用程序。
美國政府的 Section 508:這是了解美國 Rehabilitations Act 的 section 508 和相關可訪問性標準的第一站。
Google 自己的 統計報告:更好地了解目標受眾如何使用 Google。
Google PageRank:從源頭更直接地了解 PageRank。
Search Engine Marketing, Inc. :要想了解如何進入搜索索引、研究搜索者會使用哪些單詞來查找您的站點、優化站點以便此類搜索更容易找到您的站點以及增加站點的搜索訪問量的其他措施,請參閱 IBM Press 的這本新書。
DMOZ 或 Open Directory 項目:訪問這個早期的人工編輯目錄搜索的例子。Open Directory Project 是最大最全面的人工編輯 Web 目錄。它由一個龐大的全球志愿編輯社區進行建設和維護。
Safari 書店:尋找相關主題的圖書。
Web development 專區的技術庫:尋找與基于 Web 的解決方案相關的文章和教程。
獲得產品和技術
使用 IBM 試用軟件 構建您的下一個開發項目,可以直接從 developerWorks 下載。
lynx 瀏覽器:看看對于頁面閱讀器(以及搜索引擎爬行器)來說您的站點是什么樣子的。
討論
WebmasterWorld Google News Forum:討論最新的 Google 新聞。
Cre8asite Forums on Google:訪問這些關于搜索引擎營銷、實用性和 Web 設計的論壇。
developerWorks blog:加入 developerWorks 社區。