網站應具有清晰的層次結構和文本鏈接。每個網頁應至少可以通過一個靜態文本鏈接打開。
為用戶提供網站地圖,列出指向網站重要部分的鏈接。如果網站地圖上的鏈接超過或大約為 100 個,則需要將網站地圖拆分為多個網頁。
網站應實用且信息豐富,網頁文字應清晰、準確地表述要傳達的內容。
要考慮到用戶會使用哪些字詞來查找您的網頁,確保網站上確實包含了這些文字。
盡量使用文字而不是圖形來顯示重要的名稱、內容或鏈接。搜索引擎抓取工具無法識別圖形中所含的文字。
確保對 TITLE 和 ALT 標記屬性的描述和表達準確無誤。
檢查鏈接是否損壞,并確保 HTML 格式正確。
如果您決定采用動態網頁(即網址中包含"?"字符),請注意并非所有搜索引擎的抓取工具都能像抓取靜態網頁一樣抓取動態網頁。動態網頁有助于縮短參數長度并減少參數數目。
將特定網頁上的鏈接限制在合理的數量內(少于 100 個)。
技術指南
由于大部分搜索引擎 Spider 查看網站的方式與 Lynx 一樣,所以可以使用 Lynx 之類的文本瀏覽器來查看您的網站。如果因應用了 Javascript、Cookie、會話 ID、框架、DHTML 或 Flash 等復雜技術,而導致在文本瀏覽器中無法看到網站的所有網頁,則搜索引擎 Spider 在抓取您的網站時可能會遇到麻煩。
允許搜索漫游器在不采用會跟蹤其在網站上瀏覽路徑的會話 ID 或參數的情況下抓取您的網站。這些技術對跟蹤單個用戶的行為非常有用,但漫游器的訪問模式卻完全不同。如果采用這些技術,則可能會導致對網站的檢索不完整,因為漫游器可能無法排除那些看上去不同,但實際卻指向同一個網頁的網址。
確保您的網絡服務器支持 If-Modified-Since HTTP 標頭。通過該功能,您的網絡服務器可以告訴 Google 自上次抓取您的網站以來,內容是否已發生變化。該功能可以節省您的帶寬和開銷。
利用網絡服務器上的 robots.txt 文件。該文件會告訴抓取工具哪些目錄能夠抓取,哪些不能抓取。
如果您的公司購買了內容管理系統,請確保該系統能導出您的內容,以便搜索引擎 Spider 可以抓取您的網站。
使用 robots.txt 可避免抓取搜索結果頁或其他自動生成的頁面,這些頁面對來自搜索引擎的用戶沒有太多附加值。
質量指南
設計網頁時該考慮的是用戶,而不是搜索引擎。
請不要為了提高搜索引擎排名而弄虛作假。一個簡單分辨是非的方法是:您是否可以坦然地跟競爭對手網站解釋您對網站所做的事情。另一個有用的測試手段即捫心自問:"這能否給我的用戶帶來幫助?如果不存在搜索引擎,我是否還會這樣做?"
請不要參與旨在提高您的網站排名或 PageRank 的鏈接方案。尤其要避免鏈接到違禁的網站或"惡鄰",因為您自身的排名會受到這些鏈接的負面影響。