近期,捷通華聲應用最新算法,推出全新一代靈云語音識別核心引擎,識別率實現跨越式提升。目前,新一代語音識別技術已上線靈云平臺(AIcloud.com),供開發者調用,并面向政企客戶推出包含8k、16k版本的全新靈云語音識別能力平臺。
新一代靈云語音識別演示(建議全屏觀看)
此次靈云語音識別技術的升級,是捷通華聲在CTC算法的基礎上,對建模單元粗粒度、模型訓練方法、解碼幀率進行創新優化。有效提升了語音識別引擎的執行效率、魯棒性,增強了口音、語速適配能力,大幅提升了多人對講、遠場講話等場景中的語音識別率。
調用云端語音識別服務就上靈云平臺
新一代靈云語音識別技術已上線靈云平臺,開發者可以去靈云開發者社區(aicloud.com/dev/)申請調用。
開發者將靈云語音識別SDK集成到ISO、JAVA、安卓、Windows等軟件應用中后,填寫申請到的靈云平臺語音識別服務地址、授權信息,便可免費調用靈云平臺的語音識別服務。
目前,靈云平臺上的語音識別技術已服務包括打車軟件、輸入法、翻譯APP、手機銀行客戶端等各類數十萬應用,覆蓋數億終端用戶。
靈云ASR能力平臺為政企單位提供私有、專業的語音識別能力
在提供公有云ASR能力的同時,捷通華聲一直在為Callcenter、會議、公安等場景提供私有化的語音識別能力。
其中,在Callcenter電話信道8K語音識別場景,捷通華聲已服務眾多大型銀行客服中心、客服BPO中心,將海量語音實時轉寫為文字,為智能質檢、智能客服、智能外呼、數據分析等提供私有云的語音識別能力。
在會議、司法、醫療等16k語音識別場景,捷通華聲積累了大量聲學、語言數據,分別推出了會議、審訊、醫療各科室等行業版的語音識別能力平臺,為政企客戶提供專業、私有、更安全的語音識別能力。
十多年來,捷通華聲始終堅持核心技術自主研發。隨著此次靈云語音識別技術的跨越式提升,捷通華聲將為公有云開發者、政企客戶提供識別率更高、更優質的語音識別能力與服務。