語言是思維和知識的載體,驅動了人類的文明。而對話讓機器更加智能,從而更好的服務人類。如今智能對話已在AI領域成為一個新熱點,其創新和應用前景都非常廣闊。5月15日,“與未來對話——百度大腦智能對話引擎及產品發布會”正式舉行,會上首次曝光百度大腦智能對話生態,并推出全新的智能對話引擎,一場語音、語言與知識共舞的盛會拉開序幕。
“市場上,用戶對產品智能交互要求越來越高、企業對智能對話關注與需求與日俱增。百度在人工智能領域布局完善,擁有領先精湛的語音、語言與知識技術。對話技術進入工業級落地的各項基礎條件已具備。”百度技術委員會主席、自然語言處理首席科學家吳華表示。目前,百度大腦智能對話生態已形成,由對話核心技術、產品平臺,以及生態與服務三大部分組成,能為業界提供全方位的智能對話能力與建設服務。
全新發布9大核心特性打造技術最強、能力最豐富、規模最大的智能對話定制平臺
2017年7月,百度在AI開發者大會上發布對話系統定制平臺UNIT,它搭載了業界領先的對話理解與對話管理技術,可以幫助開發者賦予產品智能對話的交互能力;2018年7月,UNIT推出的2.0版本,技術、功能與架構實現全面升級,為開發者提供更加易用、更加專業的對話系統定制能力。
在智能對話領域,百度是走在前沿的創新者?;诎俣榷嗄攴e累的自然語言處理、知識圖譜和語音等對話相關的AI技術,百度已形成包含UNIT3.0和語音技術平臺的百度大腦智能對話引擎,并在此基礎上推出客服、消費電子和出行三大智能對話場景方案。會上,百度自然語言處理部主任架構師孫珂博士宣布百度大腦對話系統定制平臺UNIT3.0全新升級,并發布9大核心特性,為國內智能對話領域打造了技術最強、能力最豐富、使用規模最大的智能對話定制平臺。
孫珂介紹,深受開發者喜愛,能提供專業對話系統定制技術的UNIT平臺具有強大的對話理解及管理能力,該平臺已累計超460億次的交互量。而在應用中,從對話核心技術到一個場景化的真實對話系統落地,企業或個人開發者仍然面臨著數據標注、知識整理、系統集成的高成本投入。基于此,百度大腦推出UNIT3.0版本,在搭建技能、構建知識和整合技能與知識三方面實現全面升級。
技能搭建包括預置技能和自定義技能。此次全新發布了智能問答、設備控制、影音休閑、生活服務等多個方面共58項積累自真實業務的預置技能,沉淀了全網最全面最優質的信息類資源;同時,預置技能也支持開發者結合特定場景進行再次開發,使其更符合場景業務需要。自定義問答技能方面,全新發布了文檔問答功能,支持開發者上傳業務文檔并一鍵訓練,在1分鐘內快速定制問答系統。自定義對話技能方面,正式發布訓練數據生產與標注輔助工具DataKit,實現自動收集、篩選、預處理樣本,大幅提升樣本生產和標注效率。此外,“深度訓練”模型全新升級融入百度最新發布的語義表示預訓練模型ERNIE,可在標注數據大量減少的情況下達到同樣效果。升級后的DataKit和基于深度訓練的理解技術可謂是“強強聯合”,可使對話技能的綜合研發成本節省60%。
據了解,70%的企業在智能對話系統構建過程中,都面臨梳理和準備企業知識的困難環節,針對這一痛點,UNIT3.0在構建知識方面實現重磅升級。全新發布問答知識庫構建工具,幫助開發者構建問答知識庫,節省人工成本。新發布的圖譜知識庫構建工具可以輔助企業梳理和推理復雜知識體系,實現可視化數據生產與抽取工具。同時,生成的圖譜知識也可以導入UNIT問答技能詞槽詞典,進一步幫助對話理解效果的優化。
UNIT3.0也進一步升級了技能與知識管理能力,幫助開發者整合對話、問答技能,接入知識,通過單一接口一站式滿足復雜的對話系統研發。技能管理實現多技能順序可調,并共享全局記憶;對話管理具有在線與離線可編程對話管理框架,可適應多樣化的業務場景;知識接入方面具備圖譜知識庫、關系數據庫,HTTP服務全面支持接入。
聽懂語音、理解對話、快速反饋是智能對話中的重要組成部分,對此語音技術平臺全新升級,推出呼叫中心語音解決方案及語音自訓練平臺。在呼叫中心場景中,提供全新的端到端的語音技術解決方案,包括呼叫中心場景專屬的語音識別模型、呼叫中心場景專屬的語音合成音庫,滿足適配主流廠家MRCP對接,與對話理解深入配合,靈活支持打斷等需求,同時采用高可用流式傳輸語音識別與語音合成協議,實現全雙工流式交互,提供低延遲、高并發的企業級語音服務。
除了端到端的呼叫中心語音技術方案,全新發布的語音自訓練平臺通過使用業務場景文本語料,自助訓練個性化的語言模型,可廣泛應用于各場景,達到特定業務場景下業務用語的準確識別,有效提升業務領域語音交互體驗。
三大智能對話場景方案完美契合客服、消費電子及出行領域需求
深入落地場景,是智能對話發展的必然趨勢,也是普及化的必經過程?;谠谥悄軐υ掝I域多年的經驗、技術積累,百度大腦推出了典型的、有針對性的三大對話場景方案,分別是客服智能對話場景方案、消費電子智能對話場景方案和出行智能對話場景方案。這三大方案都從領域業務需求、集成與配合、部署與維護做出了不同程度的升級。
客服智能對話場景方案結合其呼叫中心的語音語義技術需求特點,推出全新的語音語義一體化中控,實現一次交互完成語音和對話理解服務訪問同時,預置對話中打斷、沉默、語義去噪能力可降低通話中的異常處理成本。此外,在部署與維護方面實現了云端部署和私有化部署的多樣化部署,可按需匹配。
消費電子對話場景方案綜合考慮其場景、資源的開放性,軟硬件終端產品的多元化等特點,除了前面提到的沉淀至真實場景的58項預置技能和優質的信息與問答資源外,還開源了對話管理模塊DMKit、對話中控模塊USKit,它們具備與云端理解能力無縫對接,幫助開發者深度定制對話技能。也支持公有云、虛擬私有域部署模式,提供完善的Android、iOSSDK接入方式,還可一鍵接入DuerOS和小程序等。
出行智能對話場景方案是面向出行場景專屬定制的,擁有車載專屬語音解決方案和車廠專屬語義定制平臺。車載專屬語音解決方案中有全套面向車載環境的語音喚醒、離/在線語音識別、風格發音和明星發音等語音合成聲庫以及聲紋識別能力。車廠專屬語義定制平臺提供豐富的預置能力和車廠技能自定制能力支持。此外,面向車載網絡穩定性不可控特性,我們推出了包含導航、設備控制、多媒體、通信等高質量離線預置技能,高性能離線語義嵌入式SDK;也推出了支持出行場景離在線對話能力融合的框架。
智能對話能為我們的生活帶來什么改變?“嘗鮮者”有話說。在百度UNIT的助力下,百度智能云幫助中國聯通實現全渠道、全媒體客服智能化轉型。搭載UNIT,百度智能云智能客服與聯通共同打造了智能客服平臺。好成績通過百度UNIT和語音技術,推出行業首款伴學機器人萌寶,萌寶已具備看視頻、學漢字、背單詞等伴學技能,相較傳統家教機,其學習入口更統一、交互更簡單、內容展現更直觀。好成績總經理劉橋明笑稱,“除了有過硬的技術以外,UNIT對接入用戶的響應非常快,通常來說如果用戶等待時間超過8個小時,他們一定會‘用腳投票’”。在UNIT和百度語音技術的加持下,百度車聯網的智能車載交互系統小度車載OS可以實現“聽清”、“聽懂”、“滿足”三個層次的需求。
《百度大腦智能對話引擎白皮書》發布生態伙伴體系形成
百度大腦智能對話引擎具備完善的功能及強大的AI技術,如何去使用?誰更適合使用?成為企業需要克服的下一個難點。會上,百度AI技術生態部總經理喻友平重磅發布智能對話引擎生態計劃,打通了從底層核心技術至生態與服務的各個“關節”,形成百度大腦智能對話生態閉環。現場,喻友平宣布百度大腦智能對話深度訓練營正式推出,將為企業解決關鍵人才缺乏的困難。他表示,“智能對話項目落地的效率和效果,由智能對話解決方案架構師、智能對話訓練師2個關鍵角色決定。”智能對話解決方案架構師是保證項目成功落地的“總指揮”,整體主導推進對話系統項目,保證項目效果、效率符合預期。智能對話訓練師則主導對話系統的研發和效果優化,直至達到上線要求。
此外,在百度大腦生態伙伴體系中,全新推出智能對話服務能力認證,認證需要具備的條件包含1位以上深度培養的智能對話架構師;2位以上通過考試和認證的對話訓練師;成功落地過1個應用,并且通過百度大腦效果測試。認證后可獲得認證標識、優先展示、商機拓展、深度技術支持4項百度大腦生態伙伴體系中的重要權益。
如何學以致用,在智能對話領域實現應用落地,全流程的指導不可或缺。為了進一步滿足企業推動應用落地的需要,現場也重磅推出了百度大腦智能對話引擎白皮書:提供從智能對話技術綱領到應用實踐的全面指導。
真正解放雙手的時代已到來,智能對話背后能承載的想象遠比想象更多,百度大腦能提供的全鏈條幫助也不僅如此。目前,百度大腦已開放171項領先的AI技術能力,百度AI開放平臺開發者數量超110萬,這些數據是百度大腦打造智能對話生態的充足底氣,也是推動該領域發展的重要動能。未來,百度大腦將持續發力智能對話領域,讓語言推動機器進入屬于它們的“文明階段”。