在鈦媒體在線課“鈦坦白”第43期,我們請來了三位鈦客,帶大家思考“人機大戰”后人工智能何去何從。本期鈦客之一、浪潮人工智能首席架構師張清,是《MIC高性能計算編程指南》作者,開源深度學習計算框架Caffe-MPI設計者之一。并先后主導完成語音、圖像、安適等深度學習GPU項目,并傳統HPC、視頻大數據等標的目的多個CPU多核、GPU、MIC、FPGA計算項目。
本文節選自張清在鈦坦白的分享。如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進入鈦坦白九個專業群交流,并查看更豐富的專業數據和信息,可點擊:注冊。
以下按照張清在鈦坦白的分享實錄整理:
大家好,我是來自浪潮的張清,非常感謝鈦媒體的邀請,也同樣感謝之前來自曙光和科大訊飛的兩位專家的精彩分享,我今天給大家分享的主題是面向人工智能的計算解決方案。
在分享之前我首先簡單的介紹一下浪潮在人工智能方面的工作。浪潮是先進的人工智能計算系統與解決方案提供商,擁有從人工智能計算產品研發、計算系統建設、軟件設計、系統運維辦事能力,擁有完備的人工智能端到端解決方案、計算系統軟硬件產品和應用辦事體系,在廣泛應用人工智能技術的互聯網領域,浪潮計算設備產品在中國大型互聯網市場占用率超過80%,成為中國人工智能第一品牌計算設備提供商。
AI的發展趨勢

人類已經經過了三次科技革命——蒸汽時代、電氣時代和信息時代,每次科技革命的發生都為社會帶來巨大的厘革和進步。AI時代已經到來,它可能成為第四次科技革命。下面我們來看一下AI市場、行業應用、技術的發展趨勢。
AI市場的發展趨勢

A市場正在蓬勃發展,我們從近五年人工智能的投資金額發現從2012年到2016年,年均增長率達到50%以上,截止到2016年,它的投資金額達到42.5億美元,AI近五年M&A和IPO的數量年均增長率為49.85%,2016年已達到68項,2020年AI整個的市場規模將達到480億美元。(數據來源:CB Insights)
AI行業應用的發展趨勢

2011年,谷歌和微軟研究院的語音識別標的目的研究專家先后采用深度神經網絡技術將語音識另外錯誤率降低20%~30%,這是長期以來語音識別研究領域取得的重大突破。2012年,深度神經網絡在圖像識別應用方面也獲得重大進展,在ImageNet評測問題中將本來的錯誤率降低了9%,隨著AI在語音和圖像識另外巨大成功,互聯網行業越來越多的用戶開始應用AI。從2015年開始,傳統行業越來越多的用戶也開始應用AI,好比金融企業、醫療企業、汽車廠商和安防企業等。本年,我們也看到很多傳統科學計算用戶開始研究AI技術,如氣象和石油勘探用戶,利用 AI技術來提高相關應用的預測精度。
總的來說,AI行業應用用戶已經從目前最為火熱的互聯網行業用戶,逐步發展到傳統企業用戶和科學計算HPC用戶。
AI技術的發展趨勢

我們先看兩個例子,第一個是圖像識別方面的Imagenet角逐,2012年Imagenet角逐冠軍網絡模型是Alexnet,它只有8層,訓練所需要的計算量是相對比較小的,每一張圖片只要1.4GFlop,所訓練出來的模型的精度達到84%,也就是錯誤率為16%。到了2015年,經過三年的發展,Imagenet角逐的冠軍網絡模型是微軟設計的Resnet,其變得更加復雜,模型的層數達到152層,層數是Alexnet的19倍,每一張圖片所需要計算量大大提高,達到22GFlop,但錯誤率下降為3.5%。
另一個例子更加驚人,是關于語音識別。百度設計的語音識別模型,2014年有2500萬的參數,訓練的數據量是7000小時的語料,8%的錯誤率。2015年的訓練數據是此前的2倍,深度學習網絡是本來的4倍大,2倍的數據量,4倍的網絡復雜性,實現的錯誤率是5%,但是需要付出什么樣的代價?就是計算量的增長。
所以我們從這兩個例子可以看出,AI技術的發展趨勢是朝著大數據+大模型+大計算標的目的發展,采用更大的模型和數據會使訓練出來的模型的精度大幅提高,但這需要更大的計算資源作為支撐。
AI面臨的挑戰及計算解決方案
AI主要面臨三個方面的挑戰:
一是需要獲取足夠多的標注的數據用于模型的訓練;
二是需要設計分布式深度神經網絡模型及算法;
三是需要一個大的深度學習計算平臺以及平臺辦理軟件。

針對上面三個方面的挑戰,我們從四個層次去設計整個AI計算解決方案:
第一層次是平臺層;從整個AI計算過程的差別特點需求,我們會設計數據預處理平臺、訓練平臺、推理平臺,采用差別的網絡和存儲。