搜索引擎的基本工作流程: 抓取網絡頁面-預處理-查詢服務 。本篇講講如何根據這三個流程來優化自己的網站,從而獲得免費的流量。
1. 抓取網絡頁面
搜索引擎抓取頁面就是大家常說的蜘蛛(有的地方也叫機器人)抓取。搜索引擎的一個自動應用程序,它的作用是在互聯網中瀏覽信息,然后把這些信息都抓取到搜索引擎的服務器上。簡單理解:我們可以把 搜索引擎蜘蛛當作一個用戶,然后這個用戶來訪問我們的網站,然后在把我們網站的內容保存到自己的電腦上 !下面說說兩個蜘蛛的“習慣”:
△ 蜘蛛抓取頁面流程 : 發現鏈接-下載鏈接內容-保存-取內容中的鏈接-循環。
△ 蜘蛛抓取頁面規律 : 深度優先,寬度優先,重訪優先,權重優先。
? 優化項 :
1. 提 交鏈接 :直接通過提交網址到引擎的方法讓蜘蛛知道我們的網站。這樣可以節約蜘蛛到我們網站的時間。
2. 做好 內鏈 :主要是導航,次導航與面包屑導航,頁面內容鏈接,需要清晰分布。方便蜘蛛快速抓取網站上的所有頁面。
3. URL層次不要太深 :這個針對上面深度優化與寬度優化,URL目錄越深,蜘蛛越難爬到這個頁面。
4. 做好的外鏈 :主要是蜘蛛喜歡去權重高的頁面上抓取鏈接,假如我們在網易首頁上做友情鏈接,那蜘蛛就會很快到我們頁面上來,并給予較好評價。這是針對上面權重優先。
5. 網站更新 :這里需要提到重訪優先,比如前一天蜘蛛來抓取了我們的網頁內容,而今天我們在該頁面又增加了新的內容,那蜘蛛就回來抓取新的內容。長此以往,網站在蜘蛛的“印象”中就很友好了。
2. 預處理
預處理,又稱為索引。我們知道搜索引擎蜘蛛在 爬行頁面之后會對該頁面進行提取文字信息,分詞,去噪,去重,得到一批關鍵詞集合 。之后搜索引擎會對這個集合進行 正向索引 ,即把每個頁面中的多個關鍵詞和頁面建立對應關系,同時會 記錄 這些關鍵詞的密度,頻率,表現格式等權重信息。表現格式主要是分析這些關鍵詞是否使用了H1標簽,是否使用了粗體或顏色變化,是否出現在了頁面的title,description,keywords標簽等權重標簽。
? 優化項 :
1. 代碼簡潔 :提取文字信息主要是去除HTML、CSS、JavaScript、Flash、圖片等代碼及資源。簡潔代碼可以幫引擎節省時間。
2. 關鍵詞要集中 :舉例,如果網站是要做“中國瓷器”這個關鍵詞,不要描述“中國的瓷器”,因為經過分詞,去噪后,中國的瓷器,就變成兩個詞:中國 瓷器,“的”已經消除了。引擎上搜索“中國瓷器”評定頁面相關時,中國瓷器描述一定比中國的瓷器要高。
3. 頁面相似度不能太高 :上面引擎的去重操作,會取消相似度高的頁面的保存。
4. 關鍵字密度 :引擎建議2%-8%,太少就會缺少相關性。
5. H標簽的運用 :H1用于網站唯一主標題,只用一次,大多用于資訊新聞文章的標題。H2,H3用于分類標題,可用多次。
6. 粗體 :粗體有兩種b和 strong,b主要側重于表現視覺上的強調,而strong則是指語意上的強調。一般用于優化關鍵字的話,是用strong。
7. 顏 :顏色也可強調關鍵字。
8. title,description,keywords :這三個標簽是引擎第一關注點。主要關鍵字要合理分布在這三個標簽中。
3 . 查詢服務
查詢服務就是最后的排名,當用戶查詢關鍵字后,引擎對應的查詢過程。首先把用戶搜索的內容切分為一個關鍵詞序列,我們有了搜索詞集合,再把關鍵詞所對應索引庫,計算相關性后顯示。顯示結果: title與description 。
? 優化項 :
1. title的吸引性 :用戶搜索關鍵字后,發現你的網站排名很靠前,但是你的網站標題是否吸引他去點擊,這是個問題。
2. description的描述性 :Description要把網站的大致內容描述清楚,讓用戶覺得這個網站可信。
總結:根據搜 索 引擎的工作流程,對應做出友好的行為 ,才能使網站滿足搜索引擎收錄排名需求。當網站在搜索引擎中 提高關鍵詞排名 ,就能精準地把用戶帶到網站,獲得 免費流量 ,產生直接銷售或品牌推廣。
文章轉載請保留網址:http://aberdeenanguscattle.com/news/solutions/1688.html