Google日前正式發布旗下云端語音識別API,支持80多種語言,也能辨識正體中文。而新版API加強了長版音頻檔的轉錄精準度,也新增支持WAV、Opus和Speex文件格式,且Google也宣稱,新版語音識別API比舊版的批處理速度快3倍。
日前,Google推出旗下云端語音識別API(Cloud Speech API)正式版(GA),Google云端語音識別服務能夠實時辨識80種以上的語言,轉換成文字,連正體中文也可以辨識。
Google在2016年夏天釋出云端語音識別API公開測試版,現在終于推出正式版,提供云端開發人員使用。
而云端語音識別API采用與Google Now、Google搜尋及Google Assistant相同的語音識別技術,根據Google,云端語音識別API是幾款預先訓練機器學習模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來執行如影像分析、圖像分析、文字分析和動態翻譯等常見的任務。
在正式版的云端語音識別API,Google加強了長度較長的音頻檔案轉錄精準度,以及新增支持WAV、Opus和Speex文件格式。Google也聲稱,新版語音識別API比舊版的批處理速度快3倍。
另外,目前已有廠商采用Google云端語音識別API,根據Google官網,美國德州的電話語音SaaS開發商InteractiveTel采用Google云端語音識別服務,透過實時的語音轉文字,來分析業者與顧客在電話中的互動,以協助業者提升銷售業績。