POST TIME:2018-12-03 21:45
搜索誕生于互聯網早期時代,在漫長的迭代演化中,搜索誕生了很多業界尺度功能。本篇文章會盤點搜索交互的尺度功能,同時也會介紹這些功能背后的邏輯。
前情提要一下,上一期介紹了搜索的基來源根基理:五分鐘了解搜索原理
搜索有系統詞庫和內容索引兩大部分,其中系統詞庫可以快速關聯到內容索引中,這是搜索的基礎。用戶進行一次搜索查詢,之后會經歷三個步驟:第一步,對用戶輸入信息的解讀:通過分詞,停用詞等處理方法,搜索系統首先把用戶的非尺度的輸入詞關聯到尺度的詞庫;第二步,按照用戶輸入信息對內容進行篩選:并不是所有關聯到的內容都會被篩選出來,搜索系統需要綜合考慮準確率和召回率,篩選出需要展示的內容;第三步,對篩選后的結果進行排序:搜索系統在考慮文本內容相關度和各個內容業務數據的表示之后,通過打分給出最終排序,呈現給用戶。這個綜合排序的原理,我們以基于Lucene的Solr系統進行了解釋。
本期的搜索,PC端主要拔取了Bing搜索作為案例,同時也兼顧了一些大用戶量的移動端的產品進行了增補說明。
那么,,搜索交互功能大盤點現在開始:
1. 自動補全自動補全,就是用戶在輸入框敲字符時候,會彈出下拉列表提示候選詞給用戶,便利用戶輸入,提升用戶體驗。一方面幫手用戶優化搜索條件,一方面也能夠減少用戶的輸入錯誤。自動補全的素質是按照用戶現有的輸入詞,去檢索當地詞庫中的詞,同時根據查詢量凹凸進行排序。
當然,令人欣喜的是,之后也看到了一些自動補全的變種,差別的搜索按照自身業務,調整了自動補全的展示。好比下圖某電商搜索,在自動補全的基礎上,進一步擴展了篩選條件,減少用戶操作。
2. 歷史記錄使用Bing輸入“知識就是力量”之后,瀏覽器當地會生存我的輸入記錄。下一次輸入“”知”的時候,差別于之前,搜索系統會在自動補全的聯想詞之前,增加能夠匹配我歷史搜索的輸入詞。因為素質上,人在查找信息的時候,會存在多次查找相同內容的需求。歷史記錄也是減少用戶輸入成本的有效手段。
3. 自動糾錯自動糾錯,顧名思義,檢測到用戶輸入詞錯誤,搜索系統會自動糾正為正確的結果展示。這個是系統的容錯性,減少了用戶輸入錯誤或者自己記憶錯誤(不知道某個字怎么寫,不知道單詞怎么拼)引起的問題。
內部機制為同義詞的判定。詞庫中存儲的詞不是孤立的,同時也有彼此之間的關聯,這其中有關聯詞和同義詞展示。詞庫在不停的搜索查詢中,對于低搜索量高跳出的詞會不停歸并為高搜索量低跳出的詞的關聯詞甚至同義詞。
自動糾錯也分類兩種類型:一種是直接展示系統判定正確的結果;一種是展示判定正確的結果,但是頂部展示系統判定錯誤入口。其實第二種更好一些,可以防止系統判定錯誤,而不是直接褫奪用戶的選擇(Bing就屬于第二種)。
4. 高亮顯示對于搜索結果展示時候,需要對于用戶的搜索詞進行高亮處理,主要是為了表白搜索的依據,減少用戶選擇成本。內部原理是展示輸入的原始文本和分詞。
移動端如果搜索主體為文本內容的話,大部分產品也是保存了這種機制。但是內容主題非文本的搜索系統(商品,圖片),高亮并沒有太大意義。
5. 聯想保舉搜索的查詢一般而言是多次查詢的過程,在每次的查詢過程中用戶會不停的縮小范圍或者搜索相關內容。實現機制是query的關聯性,保舉的邏輯也分為兩種:一種是關聯保舉 ,保舉相關的搜索詞;一種是擴展保舉,因為用戶搜索的不夠具體,會保舉該搜索詞更細的分類。好比下圖右側的人物和事件:
在移動時代手機屏幕資源比較緊張的情況下,一般不會直接列出來聯想保舉。但也有其他解決方案,好比在用戶有必然瀏覽深度的時候進行聯想保舉。淘寶在15個商品之后會有搜索詞的擴展保舉,如下圖所示:
7. 命中詞定制下一篇:微信憑什么敢叫板蘋果?