網站關鍵詞佈局(內容頁關鍵詞佈局優化解析)

關鍵詞是SEO的核心概念之一,SEO實踐中很多工作都圍繞關鍵詞開展。本文嘗試從搜索技術原理和網站優化實踐結合,總結內容頁關鍵詞佈局在SEO中的具體落地方法。一、搜索引擎技術原理簡述搜索引擎最核心的底層技術基礎是將用戶查詢詞切分成自然語言中有意義的詞組,然後從索引庫找到包含這些詞組中全部或部分關鍵詞的內容,返回結果。正常人的搜索思路是帶著關鍵詞,去查找內容中是否包含該關鍵詞。假設要從序號1-10的10個網頁查找包含“關鍵詞佈局”的網頁,分別去這10個網頁中全文搜索是否包含“關鍵詞佈局”這個詞,然後返回包含該詞的網頁的序號。但如果是從百萬、千萬個網頁中查找呢,速度就很慢瞭,於是就發明瞭倒排索引的概念。(以下圖中數據皆非實際數據,僅作示意)如上圖示,為一個最簡單的倒排索引模型(DocID是搜索引擎為所抓取網頁分配的唯一編號)。搜索引擎爬蟲每次抓取一個網頁的時候,就把網頁切分成若幹個詞組,將這些詞一一與倒排索引表比對:如果倒排索引表的“關鍵詞”一列有這個詞,就在其對應的倒排列表中增加當前網頁的編號DocID;如果沒有,就增加一行(涉及到新詞識別,此處不展開),給這個關鍵詞分配一個ID,再寫入當前網頁的編號。這樣,當我們查詢“關鍵詞1”的時候,很快就能知道相關的網頁有(1,2,3,5)。復雜一些的查詢詞假設被切分成“關鍵詞1”、“關鍵詞3”、“關鍵詞6”這3個詞,也能快速查詢到相關網頁有(1,2,3,5,6,7,9)。僅僅這樣,還不足以對搜索結果進行排序。非作弊的情況下,一個網頁出現某關鍵詞次數越多,該關鍵詞越能代表此網頁的特征,前提是要過濾停用詞(停用詞就是幾乎每個網頁中都有很多,但不能表達任何具體意義的詞,比如:“的”、“是”、“瞭”等等)。如果我們能在倒排索引表裡面加入關鍵詞在網頁中出現的頻率信息(簡稱:詞頻–TF),就能對網頁進行排序瞭。如下圖所示:當我們的查詢詞被分詞為“關鍵詞1”、“關鍵詞2”時,就能將相關網頁排序為(3,5,1,2)。假設現在有兩個網頁1、網頁2,在倒排索引中的信息如下圖:我們搜索“關鍵詞怎麼佈局”,搜索詞被分詞為“關鍵詞”、“怎麼”、“佈局”,其中網頁1中“關鍵詞”、“怎麼”、“佈局”分別出現2、2、2次,共6次;網頁2中“怎麼”、“佈局”共出現7次,按照前面的邏輯,最終的搜索結果排序為(2,1),這顯然不是理想的排序結果,網頁2的主題明顯是講“圍棋怎麼佈局”的。此時需要引入IDF(逆文檔頻率指數)來解決這個問題。如果一個網頁集合中包含某個關鍵詞的網頁越少,則該關鍵詞具有越好的網頁區分能力,故IDF越大,即具有更高的權重。假設上圖中的“關鍵詞”、“怎麼”、“佈局”、“圍棋”的IDF分別為2.5、0.3、0.8、3,每個詞的TF乘以IDF後求和,得到網頁1、2的相關性分別為:7.2、4.6,所以搜索“關鍵詞怎麼佈局”的排序結果為(1,2),就比較符合實際瞭。關鍵詞的位置信息也是一個重點,一般認為標題中出現關鍵詞比正文部分出現相同的關鍵詞,更能體現一個網頁的主題特征,H標簽的重要性即在於此。搜索引擎還能夠根據代碼佈局和噪音比例(如停用詞出現頻率)來判斷哪裡是導航、哪裡是正文、哪裡是側邊欄等等。在倒排索引列表中會把這些位置信息都標註進去,參與排序決策。除此之外,還有一些其他的常用技術方法,如:雙詞索引/短語索引,“關鍵詞怎麼佈局”不一定就是切分為三個短詞,還可能切分成“關鍵詞佈局”、“詞怎麼”、“怎麼佈局”等等;關聯詞合並搜索,“關鍵詞”的關聯詞“關鍵字”,“怎麼”的關聯詞“如何”等。當然,實際中現代大型搜索引擎的倒排索引模型會復雜很多,再融入其他諸多因素(一個重點是超鏈分析)參與排序算法,限於篇幅和作者水平有限,不繼續展開瞭。二、關鍵詞如何佈局1、標題中一定要有關鍵詞,但不一定要完整的疑問句鑒於搜索引擎會把查詢詞切分為N多的單詞、雙詞、短語,並在查詢時加入關聯詞合並查詢,所以標題中的關鍵詞不一定是完完整整的一個疑問句,一個典型是“做XXXX哪傢公司好”。標題中不一定需要這個完整的詞,即使標題中包含瞭這個完整的短句,也不能匹配其他完整短句,一個優質的網頁往往能匹配成百上千的長尾關鍵詞,顯然一個標題不可能全部包含。標題的另一大作用是吸引點擊,點擊率也是影響排名的一個因素,但其中的“XXXX”、“好”、“公司”這些核心詞一定要出現。2、正文自然、均勻的分佈一些核心詞和切分詞搜索引擎發展初期,很多技術人員利用TF*IDF算法權重較高的漏洞,大量堆砌關鍵詞,從而快速獲得較好的搜索排名。後來搜素引擎從算法層面修復漏洞打擊作弊,就出現瞭網絡上流行的“理想關鍵詞密度3%~8%”的觀點。首先,這個密度不是計算完整查詢詞的,而是切分後的詞全部計算,並且實踐中,你會發現有關鍵詞密度稍微低於3%的,也有關鍵詞密度高出8%很多的網頁能夠獲得不錯的排名。如果你是搜索引擎的工程師,會怎麼做?我想我會結合全網的歷史訪問數據(如百度統計、手機百度等都能獲取較全面的訪問數據)和關鍵詞密度信息劃定一個合理范圍和警戒范圍,超出警戒范圍的給予沉默處理,在警戒范圍區間的結合該站點歷史數據和第一階段的小流量排名的訪問數據反饋,決定是打壓還是維持或給予更高的排名。相比於關鍵詞密度,我們更應該註重的是語言的通順流暢(一味地強插關鍵詞顯得囉嗦和別扭)和內容的質量深度。畢竟,搜索引擎的排序因素多達成百上千個,也不能顧此失彼。3、正文下方相關內容和側邊欄推薦適當佈局關鍵詞雖說搜索引擎能夠通過代碼和噪音比例判斷這些不是正文部分,從而降低一些此處關鍵詞的權重,但從百度快照緩存來看,還是有一點作用的。正文下方和側邊欄的相關內容和推薦內容多是從橫向和縱向兩個角度選取內容。比如本文,主題是關於“關鍵詞佈局”,那橫向推送一些“網站結構佈局”、“關鍵詞挖掘技巧”等站內優化方面的內容,大概率是有很多訪客感興趣的;縱向推送一些“教你怎麼建設高質量的外鏈”、“如何提高著落頁的轉化率”等內容,也是訪客可能暫時抑制的隱性需求。增加瞭關鍵詞佈局的同時,還能提高PV,降低跳出,提升用戶體驗,何樂而不為。作者:建站監理網來源:盧松松博客,歡迎在線投稿

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://kuaisubeian.cc/48625.html

kuaisubeian