36氪獲悉,國內智能語音交互領域的初創公司“標貝科技”已完成5000萬元人民幣A輪融資,本輪融資由深創投領投,恒生電子(600570)跟投。據悉,本輪投資將會用于拓展業務規模,以及人才梯隊建設、前后端系統建設以及新型技術的研發。此前,標貝科技在2017年獲得了千萬元人民幣級別的Pre-A輪融資,由凱泰資本投資。
標貝科技是36氪持續關注的一家AI公司,成立于2016年2月,最早做數據服務,現已升級,主要做語音合成(TTS)整體解決方案及相關數據服務:所推出的名為“聲音超市”的產品,可提供多音色的語音合成服務;數據服務主要包括音庫制作、文本標注、評測系統、語音轉寫、聲音采集標注等。
作為人機交互的重要領域,語音合成技術近兩年發展迅速。端對端合成技術,以及神經網絡聲碼器技術的研究成果,使得語音合成的效果大幅提升。語音合成技術的應用也成為這兩年智能語音交互領域的一個熱點。國外,去年,Google系的Lyerbird推出了一套“只需一分鐘的聲音樣本就能模仿任何人說話”的系統;今年,微軟在其公有云平臺上推出了語音合成定制服務產品Custom Voice。國內,訊飛推出了“訊飛留聲”,只需要10段的聲音采集即可完成個人聲音的復刻。
標貝科技是國內語音合成領域以技術見長的創業公司。當下其優勢體現在語音合成效果更好,“個性化聲音”定制實現周期更短。這與團隊技術背景及數據積累有關。數據上,團隊此前做語音數據服務,積累了大量的語料數據。同時,研發了高效的數據標注工具,提高了數據標注的效率。技術上,CTO李秀林從事語音行業十余年,曾就職于百度,并帶領團隊獲得百萬美元大獎。
產品方面,今年5月,標貝科技打造了“聲音超市”,為客戶提供一個可供選擇的、所聽即所得的聲音平臺。主要按照API調用、SDK進行收費。目前已為360、網易等提供數據及語音合成技術服務。
與語音識別、語義理解等智能語音交互的技術相比,語音合成技術被認為是有機會單獨存在而無需做全棧的一個方向。且隨著技術的成熟,開始在諸如語音交互、有聲讀物、新媒體、智能客服、泛娛樂領域開始被應用。這也是當前標貝主要商業落地的領域。
CEO劉博介紹,目前在智能客服領域,標貝已與智齒等建立合作,進入銀行和金融機構;在有聲讀物、新媒體等領域,標貝已與央視、出版社等達成合作;在語音交互領域,標貝的主要客戶為智能音箱客戶;在泛娛樂領域,也與幾個明星工作室達成了合作;整體來看,目前智能客服領域的付費能力更好,預計明年新媒體、有聲讀物領域的付費能力會有所提升。
現階段,標貝科技的主要營收還是來自于數據業務,主要客戶包括了阿里、百度、騰訊、搜狗等。根據獵云網的數據,標貝科技已成功為客戶提供了總規模約1500小時的IP語音庫數據。
劉博認為,對標貝來說,當下技術與數據兩項業務都會是公司重點。數據方面,公司去年開始已將部分資金投入到特色IP聲音數據的儲備;技術方面,公司目前的時間窗口還有半年左右,明年新的技術會突破。
當BAT等大廠開始關注到語音合成技術,語音合成的賽道未來競爭也很可能更為激烈。劉博認為,一方面,大公司往往需要做全棧技術,技術上未必有創業公司專注,另一方面,標貝科技目前會從三方面提升競爭力,包括提升數據壁壘、廣泛布局聲音類型IP、技術上尋求新突破。