采訪到北京捷通華聲語音技術有限公司(以下簡稱捷通華聲)總經理武衛東先生,是在位于中關村軟件園的捷通華聲總部。11月28日恰逢捷通華聲2012靈云發布會,由于武總忙于處理 靈云發布會事務,本打算縮短采訪時間,可隨著交談的深入,時間卻在不知不覺中延長了。
上圖為:北京捷通華聲語音技術有限公司總經理武衛東
與其說是一次專訪,更確切地說,是武總帶給我的一場關于靈云、關于智能人機交互(HCI)、關于客戶需求、關于競爭等的精彩講座。
從開始到結束的整個采訪過程中,武總的健談、熱情洋溢、聲情并茂一直在感染著我。當然,感染我的并不僅僅是這些,確切地說,更多的應該是他傳遞出的一種務實的個人魅力,以及整個捷通華聲公司專注技術、執著創新的企業精神。
CTI論壇記者:武總,請您談一下智能人機交互(HCI)技術在產業中的發展。
武衛東:人與機器的交互經歷鍵盤時代、鼠標時代、觸控時代,現在已經進入到了人機交互時代。實際上智能人機交互(HCI)技術方面很早就已經有研究了,比如說我們的語音合成,90年代末和現在所展現出來的效果有著天壤之別,那個時候就是一直在做研究,但并未真正實用化。每一項技術都會經歷一個發展和成熟的過程,包括OCR、手寫、語音并不是一開始就做的很成熟。
隨著互聯網、移動互聯網、云計算以及3G技術、甚至是4G LTE的發展,這些技術隨著硬件的發展而發展,隨著整個產業的發展而發展。所以有一種觀點認為,用硬件帶動軟件,也有一種觀點是以軟件促進硬件。只不過隨著整個產業的發展和時代的變遷,人們的需求越來越還原到自然感官狀態。其實隱藏在這種發展的背后,是人們對需求的渴望。
人機交互技術越來越貼近自然,這里的自然實際上是人的一些本能反應,比如說我們寫東西用手、說話用嘴、聽東西用耳朵、看東西用眼睛,甚至現在發展到通過腦波來知道你心里所想。腦波識別在一些尖端領域已經開始應用,相信這種技術在不遠的將來也會像目前的語音交互、圖形圖像、手寫識別、OCR、包括涉及到自然語言處理的技術,進入人們的生活當中。
因此,我認為智能人機交互(HCI)技術本身是沒有止境的,而現在的技術還要不斷地向前發展,所以面對這樣一項技術、這樣一個領域,我們必須要做到專注。要有科學的精神、科研的心態。
CTI論壇記者:請問靈云的應用情況及發展前景如何?
武衛東:靈云是全球第一個全方位的智能人機交互(HCI)感知云。目前靈云主要有語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)、人工智能(AI)這五項核心技術。通過靈云,可以使任何一臺連接了互聯網的PC、手機或其他嵌入式設備具備語音合成、語音識別、圖像識別、手寫識別和自動翻譯的功能,簡單的說就是讓機器能說話、能聽懂人的話、能閱讀圖片以及能理解人寫的字,從而使設備具有基本的人機交互能力。
捷通華聲是一個比較務實、扎實的公司,我們希望把靈云能力向各個行業輸出,現已與數千家企業合作,不僅包括政府、金融、能源、教育、醫療、交通以及電信運營商等傳統行業領域的客戶,更有智能家電、智能家居、互聯網及移動互聯網、智慧城市等新興領域的用戶,大到服務成千上萬用戶的平臺,小到個人開發者,捷通華聲的智能人機交互(HCI)技術在中國已經無處不在,默默服務數以億計的大眾。
目前,這些智能人機交互(HCI)能力已經在各個行業里顯現出需求的價值,只是過去提供的都是單一的能力,而靈云提供的是全方位、多能力的云服務平臺,將各項成熟的人機交互技術整合到我們的平臺中,通過垂直的輸出能力讓大家使用。我們有一個觀點就是:靈云是大家的,智能人機交互(HCI)技術是人類所共享的,而我們把它開發整理好供大家使用。
我們也會在某些方面做一些自己應用,其中包括示范性應用以及實際結合用戶需求的應用。
后續我們還會與合作伙伴共同推出人臉識別、手勢識別、指紋識別、虹膜識別、聲紋識別等等識別,從而使靈云更加豐富、更加全方位,這也是我們的目標。
在提供多能力方面,我們更多考慮的是用戶需求,提倡的是技術服務生活。所到之處,都能聽到捷通華聲的聲音,比如在機場、高鐵、醫院等地方,能夠給老百姓的生活帶來便利是我們最大的欣慰。
CTI論壇記者:請問靈云在移動互聯網領域有哪些應用和布局?
靈云推出以后,我們會面向移動互聯網去做一些推廣,主要有兩個方向。
武衛東:首先,是和電信運營商合作。現在靈云和中國電信EMP平臺進行了無縫銜接,已經面向個人開發者及中小企業開放,大家可以調用靈云的能力,去開發一些移動終端包括手機端的的應用。
我舉一個例子,有一位開發者在電信的EMP平臺上開發了一項手機終端幼兒教學的業務,非常具有創新性,其中用到靈云的三項能力,這個非常具有創新能力的應用一下子就獲得多項大獎。目前,已有兩款中小企業開發應用使用了靈云能力,并已形成商務合作。其中一個是與導航有關的應用,另外一個是關于出租車叫車系統的應用。
另外,我們自身希望能夠調用靈云能力去開發一些應用產品,比如說手機助手小唐龍。同時,我們已經開展了一些智能領域的合作,比如說智能電視、車內服務的客服平臺上,還有就是一些客服,比如運營商的一些客服上面,簡單地說就是可以通過小唐龍問話費、流量、運營商的信息、活動,類似于客服的性質。
靈云在部署形式上有公有云和私有云兩種形式,使用上分為免費和授權兩種。公有云,可以為每個在公有云注冊的用戶進行單位時間內有限流量和有限次數的免費服務,以及提高流量和次數上限的授權付費服務。靈云私有云,是專門為大客戶定制的產品,可部署在用戶的現場網絡中,并根據用戶的使用需求,定制嵌入式模塊,例如嵌入自動服務設備、OA系統和郵箱系統等。