如今的技術開發成果已經讓人印象深刻,計算機可以辨識圖片和視頻里的東西,可以將語音轉化成為文字,其效率已經超過了人力范疇。Google也將GoogleTranslate辦事中添加了神經網絡,現在的機器學習在翻譯水平上已經逐步迫近人工翻譯。現實中的一些應用也讓人大開眼界,好比計算機可以預測農田作物產量,其準確性比美國農業部還高;機器能更加精準的診斷癌癥,其準確度也比從醫多年的老醫師還要高。
深度學習在當下已經成為熱詞,人工智能教育踐行者葉偉志認為雖然深度學習的成果不停涌現,但深度學習目前還存在著很多問題,任重而道遠。
一、現在的機器學習缺乏交互學習的能力
現在一個深度學習的模型,如果拿到一個新的數據集上訓練一遍,它會把本來在老數據集上訓練的東西全部忘掉。這里需要一種學習能力是自主學習,我們需要這個機器能夠本身去尋找具有價值的一些數據和狀態。
第二種學習方式叫做交互式學習,人類在學習的時候,除了我們本身去不雅觀察這個世界,總結規律以外,很多的學習來源于和人的交互中得到。
還有一種重要的學習方式是創造性學習,人的智力的核心是具備本身學習和自我創造的能力,現在的機器學習,在這方面非常缺乏。
二、現在的機器缺乏常識
一個典型的例子是自動駕駛,學過開車的都知道,從開始學到能夠熟練的開車,可能有幾百公里的駕駛路程就可以了,谷歌的無人車到目前為止已經開了幾百萬公里,還是做不到無人完全自動駕駛。其中最主要的一個原因,它不像人類具備一些常識性的推理能力。
這導致的后果是它需要研究人員或工程師,在每一種可能遇到的路況都要做特定的處理,需要在它這幾百萬公里的數據里面,盡量的覆蓋可能多的交通狀況和路況。即便如此,它還是不能夠保證能處理遇到的一些新路況。人類學習開車,主要學的是控制標的目的盤和踩油門,針對前方路況是要開過去還是減速,人類通過常識就可以做到。
三、現在的機器學習很難從少量的標注數據進行學習
好比ImageNet角逐,每一幅圖,機器平均有上千個樣原來學習。而對于人類,要學習識別一個新的物體,給他看一兩眼大概就能學會了。
怎么樣才能夠有效的利用少量的標注數據進行學習呢?其中重要的一點就是我們需要有非常好的特征體現,好的特征體現需要有大量的數據才能學到,而大量沒有標注的數據,則需要通過非監督的方式才能有效的把里面的特征體現很好的學習出來。
怎么樣做到非監督學習呢?就是通過對未來的預測進行非監督學習。能夠對未來做出預測是智力一個非常核心的部分。物理學是對一個簡單系統比較精確的預測,而深度學習或者人的智力是對一個復雜系統近似的預測。如果我們能夠對未來進行一個比較好的預測,那就說明這個模型能夠抓住環境,以及變革的素質規律,從而能夠提取出一些比較有用的信息,這樣能夠有效的把它用于少量的標注數據的學習。
四、現在的很多成功應用是基于標注好的一些標注數據來學習
對于人類來說,如果要鑒別兩只鳥,我們學習的過程就是,按照以前人類的知識,總結出兩只鳥尾巴長短會的差別,以前的經驗還會總結出這兩種鳥的頭部花紋的差別。人類在接受了語言的描述,,知識和經驗的累積,可以非常快的學習。現在機器還沒有措施把人通過語言來傳遞的這種知識和標注數據,有機的結合進行學習。
葉偉志,壹企問咨詢總經理,廣東天使會合伙人,人工智能企業應用專家,資深軟件開發工程師。