什么是人工智能?Nuance認為人工智能的本質是要重塑人和科技之間的關系,使人可以用更加自然順暢的方式與機器進行交流,從而掌握和使用愈加復雜和先進的科技。這也是未來人機交互技術發展的重要趨勢。
在之前的文章中我們談到Nuance在人工智能方面具有四大核心技術,即智能交互技術,個性化,情境化及知識。本文將就這四大核心技術進行更為具體的介紹。
智能交互
智能交互需要運用語音、自然語言理解和對話技術以支持高質量以及類人的協作式對話。這其中包括:
深度自然語言理解。想必大家對自然語言理解技術都有一定的了解。現在大部分的自然語言理解技術能夠實現的是從一句話中提取一個指令。但如果一句話中包含了多個主題,甚至語義發生了轉折,現在的自然語言理解技術還不是能夠很好的理解這樣的指令。
例如下面這句指令“我想去一家意大利餐廳,之后再看一個法國電影。”這一句話中至少包含了兩個事件,“意大利餐廳吃飯”以及“看法國電影”,這不僅需要技術對兩個事件進行關鍵信息搜索,還需要對兩個事件進行先后順序的排列,這就超出了一般自然語言理解技術的范疇,需要運用深度自然語言理解進行處理。
自然語言生成。現在的語音交互系統大部分是經過提前設計的,需要遵循一個固定的流程,當對話到達某一個固定的階段,系統的反饋一定是類似的,有的時候甚至是一成不變的。這樣的交互并不能夠提供和人一樣交流的體驗。而自然語言生成能夠結合用戶的個性化信息以及情境化信息做出反饋,而每次的反饋也是不一樣的。
例如我們發出指令“導航到附近的洗車中心”,現在我們能夠預料的系統反饋基本是會為我們提供一個列表,讓我們選擇去哪一個洗車中心。而擁有了人工智能之后,系統會結合分析更多的信息,給出“明天有降雨,您確定要洗車嗎?”這樣更加貼心,類人化的回饋。
個性化和情境化
個性化指的是運用機器學習的用戶模式提供了高度針對性的預測和建議。
情境化指的是汽車助手可以根據當前駕駛員和汽車的環境對自己的行為作出調整。二者相結合能夠為用戶提供更加貼心的使用體驗。
當用戶發出一個語音指令,指令通過語音識別和自然語言理解之后,這一指令并沒有被直接送往內容庫和知識庫,去尋找相關的答案或者觸發相關的操作,在此之前系統會再綜合集成用戶的個人偏好。例如用戶在搜索停車場時,系統就會考慮用戶是比較關注價格,還是比較關注距離,以及天氣,燃油剩余,地理位置的情境化的信息。之后再給出一個優化的搜索結果。
知識
知識是指系統在原始數據和內容變得相關時提供給駕駛員。
例如在上圖“在Texas廣場附近找一個停車場”的任務中:
知識負責從傳感器、本地數據庫、云和其他來源的有價值的情境化信息的融合。
個性化和情境化負責高度針對性的例如“更加便宜”“距離更近”等個性化和情景化的推薦。
智能交互能夠讓駕駛員很自然表達自己的意圖,通過自然語言生成將建議反饋給駕駛員,駕駛員還可以進一步選擇改進建議,最終駕駛員確認并觸發系統后續行為。
通過智能交互,分析用戶個性化以及情境化信息,經過推理引擎,最終結合知識庫,Nuance為用戶提供了協助式的對話管理。它是基于任務的,具有協助功能,旨在幫助用戶簡化交互過程,幫助用戶更快更有效的找到他們想要的,更符合他們意圖的內容或完成相應的操作。這樣,在駕駛的過程中,盡量減輕他們的手,眼,大腦思維產生的額外負擔,更加方便快捷的完成任務。