不管人類是否樂意,人工智能的車輪已經碾過來了。
智力游戲、國際象棋、圍棋、德州撲克……人類逐步淪陷,從去年AlphaGo和李世乭對決前大眾認為人類必贏的呼聲,到如今圍棋第一人柯潔迎戰AlphaGo,卻面臨大眾“機器必贏”的預測。而在關于“人工智能會取代人類嗎?”的追問里,人工智能已經選擇了下一個對手。
5 月 27 日至 28 日,由機器之心主辦的 2017 全球機器智能峰會(GMIS)在北京舉行,不但云集LSTM 之父Jürgen
Schmidhuber等人工智能業內大咖,分享主題演講,還設置了各類展覽。其中,搜狗汪仔機器人尤為引人注意。峰會期間,它不但在搜狗展位與不雅觀眾進行了親密互動,還和人類頂尖速錄員進行了一場“人機大戰”。

比擬之前大多圍繞基礎速記展開的對戰,這次的角逐難度飆升了數級,普通文章、專業詞匯、方言口音、中英混合內容、繞口令,五項角逐內容,都是語音識別領域最難并吞的的技術點。晦澀難懂的專業術語,機器能懂嗎?帶有口音的港普機器能識別嗎?兩國語言混雜,機器又能反應過來嗎?人類是在機器不擅長的領域尋求本身的優勢。
隨著峰會現場音頻響起,大屏兩側實時出現了對戰雙方的轉錄文本。一邊是人類速錄員,正常打字速度,能到每分鐘 220 字以上,一邊是搜狗汪仔,背后語音識別技術加持,還能按照上下文意自動調整轉化的內容。

普通內容的語音識別對于人機雙方都并不難,人類和機器均快速準確地完成了速記任務。但從第二輪比拼開始,人類和機器就同時面臨了艱巨的挑戰,“解耦神經接口”“誤差真值梯度”等難以理解的專業詞匯,說話人的四川方言和港普口音,以及中文夾英文的說話方式,讓速記難度飆升。中英混合的說話方式,對于機器的影響顯然更大,最終機器以4: 1 戰勝人類速記。

賽后,搜狗CEO王小川總結說:“AlphaGo2. 0 在圍棋上戰勝人類,讓我們為技術發展而喜悅。但當我們回歸真實的使用場景,,就會發現,今天的人工智能與我們抱負中還有差距,所以通過這次人機大戰,我們會開始思考,在人工智能技術前沿,我們還有什么地方是做不到的,以及未來還有哪些突破的標的目的。”

實際上,這并非搜狗語音識別技術的首次公開表態。早在 2016 年 7 月,極客公園奇點大會上,搜狗語音就在演講現場做了實時字幕上屏,演講者語畢,不雅觀眾就能直接獲得機器所做的速記稿。實際上更早之前,搜狗輸入法中就落地了語音輸入功能,語音輸入日頻次高達2. 4 億次,識別速度達每分鐘 400 字。
除大戰之外,搜狗也應邀為此次大會提供了機器同傳辦事,當嘉賓進行演講時,通過語音識別技術,機器將演講者的語音轉化為文字,同時,搜狗機器同傳對內容進行翻譯,投射在屏幕上。通過此項技術,即使不使用同傳設備,中外嘉賓也能夠無障礙理解嘉賓的演講內容。

AlphaGo2. 0 引發的人機大戰在圍棋領域,然而我們更多的只是作為“吃瓜群眾”感受到人工智能的威力,對它的應用場景卻感知甚微。而汪仔引發的人機大戰,背后則展示了搜狗在如今大火的語音識別領域的突破性成就。結合搜狗輸入法這款國民級產品,搜狗不但實現了語音識別技術的落地與靈活使用,更在醞釀著人機交互方式的全新厘革。