在剛剛結束的“Blizzard Challenge 2014”國際語音合成大賽上,科大訊飛通過承建的語音及語言信息處理國家工程實驗室報送的參賽系統在25項測試指標中的11項位列第一,取得了綜合排名第一的好成績。這是科大訊飛自2006年首次參賽即奪冠以來,第九次蟬聯該項賽事桂冠,持續鞏固了訊飛智能語音技術的全球領先地位。
Blizzard Challenge是由美國和日本聯合發起的國際上規模最大、最具影響力的語音合成大賽,歷屆大賽吸引了美國卡耐基-梅隆大學、英國愛丁堡大學、日本名古屋工業大學、IBM研究院、微軟亞洲研究院等語音技術領域的世界一流研究機構與企業參加。
與歷屆相比,本次大賽首次將主要測試語種由英語轉換到非英語語種,要求提交的語音合成系統包括印地語、阿薩姆語等六種印度語種,并增加了這些語種與英文混讀情況下的合成測試,進一步增加比賽的難度。在評測過程中,組織方選擇了5個語種基于統一測試平臺進行主觀測聽,每個語種的測試指標包括相似度、自然度、可懂度、英文混讀相似度和英文混讀可懂度共5項指標。
在不到兩個月的時間內,研究團隊克服了時間緊、語種多、小語種資源受限等困難,充分發揮了科大訊飛的核心技術優勢,采用基于統計聲學模型的單元挑選與參數合成技術方案,并研發了基于深度神經網絡的語音合成新方法,高質量完成了所有語種語音合成系統的構建。最終提交的參賽系統獲得了印地語合成語音相似度與可懂度、印地語英語混讀合成語音相似度與自然度等共計11個指標的第一名。
一直以來,科大訊飛的語音合成技術代表著世界最高水平,不僅中文語音合成技術超過了普通人說話水平,而且在英語等多語種語音合成上牢牢樹立了國際領先地位。未來科大訊飛將積極開展人機對話、小說合成等熱點領域的研究,著力提升語音合成的表現力和真實感,通過多語種語音處理、個性化、定制化等技術,進一步擴大應用范圍,不斷提升核心效果。
此次榮獲國際語音合成大賽九連冠,進一步擴大了科大訊飛在多語種語音合成等關鍵技術領域的國際領先優勢,對推動智能語音技術在社會各領域的深入應用、贏取國際競爭、開拓國際市場等方面具有重大而深遠的戰略意義。
(語音及語言信息處理國家工程實驗室是由國家發改委于2011年批復成立,由科大訊飛和中國科學技術大學聯合共建,是我國智能語音領域唯一的國家級研究平臺。)