POST TIME:2018-12-03 17:41
頁面自動生成機制,只的是從“導詞-上線-調優”的整個過程,機器自動生成,人工輔助調參的。適用于擁有大數據量的站點。并且很久之前就有人在用了,算是古老的套路了。 當然小站點、新站點也不是不成以,只不過需要度過資源空短期。 好比這是14年收的一個小單站,之前SEO流量就沒超過1萬,年底做了部分“頁面自動生成機制”,很粗糙,然后等了3個沒動靜,第4個月終于開始有變革,然后流量一直漲漲漲漲,之后一直不變在10萬擺布,又掉又漲,過了一年后,開始掉掉掉,因為系統長時間不調整,灌進來很多垃圾詞和垃圾數據。
好比這是本年初做的微小規模的站群,同樣的套路,但是因為經過一年多的各種折騰,程序開發上的能力比之前牛逼許多,所以上數據的速度和規模也比之前大很多。一個半月流量從0到1萬,然后因為某次系統更新,新上了一套模板,URL格式與之前的頁面一樣,好比都是:domain.com//.html,造成了URL路由負責沖突,導致一堆頁面打開返回500,過了半個多月才知道…..然而任何因為“網站不變性”造成的SEO損失,都是很難逆轉的。
下面是“頁面自動生成機制”的流程:
關鍵詞導入模塊
從各種渠道拉出一批行業詞根 圍繞這些詞根去挖詞 挖出的詞,過濾掉涉嫌違禁、擦邊、敏感、自定義黑名單、重復的詞 因為各種擴詞渠道,擴出的詞可能與所屬詞根,完全不相關。所以需要計算一下擴展詞與對應詞根的字符串相似度,相似度高的,則為同一類詞。 好比 “奧迪二手車價格” 的擴展詞有 “5萬以內二手車 ” 和 “奔騰二手車價格”;
“奧迪二手車價格”與“奔騰二手車”的相似值為:0.71875 “奧迪二手車價格”與“5萬以內二手車”的相似值為:0.3750
相似值>=0.45的為同類詞,則“奧迪二手車價格”與“奔騰二手車”是相關的,“奧迪二手車價格”與“5萬以內二手車”是不相關的。
相關且有搜索量的詞,,進入該行業頻道的詞表,生成的頁面給予最大的資源支持;相關但無搜索量的,給予較小的資源支持;不相關但有搜索量的,進入初始搜索詞表,該詞不歸屬于任何一個行業;不相關還沒搜索量的,直接刪除。
初始搜索詞表中的詞,依次通過相似度計算出與該詞最相關的N個搜索詞,作為“相關保舉”板塊的鏈接調用的邏輯。
內容獲取模塊
針對行業頻道詞表的詞,依次抓取每個關鍵詞的相關信息,信息來源如抓取各類搜索引擎搜索結果的正文、各類門戶搜索結果的正文等等 過濾掉涉嫌違禁、擦邊、敏感、自定義黑名單、重復的內容 剩余內容寫入內容數據表
頁面生成模塊
差別類型站點,頁面自動生成機制的模型差別,本渣渣用過僅是“純信息展示”類的站點。
如果網站是一個多邊產品,那在模型的設計上需要考慮更多的因素,好比涉及B端和C端的平臺產品,SEO頁面的設計上還需要考慮對B端流量分發均衡的情況等。
有興趣的話,可以去Google專利搜索“阿里巴巴 SEO”,有一些阿里巴巴SEO的專利,可以瞅瞅,不過絕大部分手段都有很高的數據和技術上的門檻。