POST TIME:2018-12-03 21:12
文/顏萌 李林(編譯)
量子位 出品 | 公眾號(hào) QbitAI
所到之處,英偉達(dá)CEO黃仁勛例行強(qiáng)調(diào):我們是一家AI公司。
誰又能說不是?
市值兩年上漲 7 倍,芯片供不該求,屢戰(zhàn)英特爾,堅(jiān)持懟谷歌,是當(dāng)前AI大紅大紫中的實(shí)力玩家,也是AI大潮中最閃亮耀眼的明星縮影。
創(chuàng)立 24 年來,從游戲芯片供應(yīng)商,到AI芯片壟斷者,英偉達(dá)儼然歷史欽定。
不過,回溯英偉達(dá)的風(fēng)云際會(huì),歷史進(jìn)程縱然功不成沒,個(gè)人奮斗更是不容忽視——沒有瀕臨破產(chǎn)時(shí)的豪賭,沒有在CUDA上百億美元的押注,又怎會(huì)有如今風(fēng)光無限的英偉達(dá)和黃教主。
《紐約時(shí)報(bào)》記者Don Clark,決定揭秘英偉達(dá)“奇幻漂流”背后的關(guān)鍵時(shí)刻。
這不止是一個(gè)豪賭出奇跡的案例。
英偉達(dá)轉(zhuǎn)折點(diǎn)
轉(zhuǎn)折點(diǎn)是“CUDA”。
CUDA,英偉達(dá)的并行計(jì)算平臺(tái)和編程模型。在它出現(xiàn)之前,英偉達(dá)的主要芯片GPU只是一個(gè)負(fù)責(zé)在屏幕上繪制圖像的“圖形處理單元”。
但CUDA的出現(xiàn),讓GPU擁有解決復(fù)雜計(jì)算問題的能力,可以幫手客戶為差別的任務(wù)對(duì)處理器進(jìn)行編程。
好比遠(yuǎn)在波蘭的圖像識(shí)別公司CTA.ai,可以用它幫手篩查腸道圖像——僅需要病患咽下一個(gè)藥丸大小的傳感器,就能讓醫(yī)生檢測(cè)腸道功能紊亂的速度能夠比視頻檢查快速70%,不但檢查成本降低,并且診斷結(jié)果更精確。
對(duì)于類似的GPU應(yīng)用,CTA.ai并不孤單。
GPU也正出現(xiàn)在越來越多出現(xiàn)在新興設(shè)備上,好比無人車、機(jī)器人、自動(dòng)駕駛汽車、辦事器、超級(jí)計(jì)算機(jī)和虛擬現(xiàn)實(shí)設(shè)備。
它幾乎是AI市場(chǎng)最為核心的需求品類,因?yàn)楫?dāng)前只有英偉達(dá)的GPU,才能快速處理各種復(fù)雜的人工智能任務(wù),如圖像識(shí)別、臉部識(shí)別和語音識(shí)別,甚至深度學(xué)習(xí)加速、氣候建模,石油勘探都必需標(biāo)配GPU。、
實(shí)際上,這樣的應(yīng)用,遠(yuǎn)超老黃的最初預(yù)期。
黃仁勛生于臺(tái)灣,在俄勒岡州立大學(xué)和斯坦福大學(xué)學(xué)習(xí)電子工程,后來在硅谷的芯片制造商工作。
1993 年,他和Chris Malachowsky、Curtis Priem一起創(chuàng)辦了英偉達(dá),最初,他們給游戲PC提供視覺特效,幫它們和那些專業(yè)的電子游戲機(jī)競(jìng)爭(zhēng)。
Malachowsky說,公司最初的產(chǎn)品并不可功,而圖形市場(chǎng)對(duì)手眾多。后來,英偉達(dá)重組了它的產(chǎn)品和戰(zhàn)略,逐漸與對(duì)手拉開距離,最終成就了在游戲PC中GPU加速器卡的絕對(duì)的領(lǐng)導(dǎo)地位。
GPU生成三角形以形成框架結(jié)構(gòu),模擬對(duì)象,為顯示屏上的像素賦予顏色。要做到這一點(diǎn),必需并行執(zhí)行許多簡(jiǎn)單的指令,這就是圖形芯片隨著微型處理器數(shù)量的增加,性能優(yōu)化的原因。
如何最大化利用這些微處理器的并行計(jì)算能力,始終是英偉達(dá)核心關(guān)心的問題。
也是CUDA誕生的原因。
實(shí)習(xí)生杰作
2004 年,斯坦福大學(xué)博士生Ian Buck進(jìn)入英偉達(dá)實(shí)習(xí),這是CUDA研發(fā)的開端。當(dāng)時(shí),Buck參與過一項(xiàng)編程競(jìng)賽,任務(wù)是讓能更容易地辦理GPU的眾多計(jì)算引擎。
△ Ian Buck 來源:heise.de
CUDA的核心設(shè)計(jì)理念就是計(jì)算機(jī)中的線程。與傳統(tǒng)CPU中的4、 8 和 16 個(gè)線程差別,GPU中的線程可以多達(dá)幾萬個(gè)。
Buck體現(xiàn),看起來這些線程的辦理是一件十分復(fù)雜的事情。但實(shí)際上,編程人員主要的困難在于如何發(fā)揮這些線程的優(yōu)勢(shì),而不是辦理這些線程。早期,CUDA的性能主要依賴編程人員人工發(fā)現(xiàn)代碼中可并行計(jì)算的部分。
目前,隨著CUDA庫的發(fā)展,這方面的工作開始越來越自動(dòng)化。CUDA團(tuán)隊(duì)已經(jīng)開發(fā)了很多石油、天然氣和國(guó)防等相關(guān)產(chǎn)業(yè)所使用的科學(xué)計(jì)算方面的庫。最終, 2012 年發(fā)布的Titan超級(jí)計(jì)算機(jī)使用了 18688 個(gè)NVIDIA Tesla K20 GPU作為協(xié)處理器,標(biāo)識(shí)表記標(biāo)幟著GPGPU在高性能計(jì)算方面的成功推廣和應(yīng)用。從 2011 年開始,Top 500 的超級(jí)計(jì)算機(jī)中至少有 50 臺(tái)會(huì)使用GPU進(jìn)行加速。而這些機(jī)器基本上也都出現(xiàn)在Green 500(全球節(jié)能超級(jí)計(jì)算機(jī)榜單)的列表中。
Buck曾體現(xiàn),在CUDA的應(yīng)用傍邊,最讓其影響深刻的就是,,乳腺癌檢測(cè)和診斷的系統(tǒng)。與傳統(tǒng)方法比擬,采用支持CUDA編程的Tesla GPU后,醫(yī)生能夠更早、更精確地發(fā)現(xiàn)乳腺癌。而美國(guó)國(guó)家癌癥研究所數(shù)據(jù)顯示,基于CUDA的系統(tǒng)在運(yùn)行蛋白質(zhì)配體運(yùn)算(用于研發(fā)治療癌癥和老年癡呆癥的新藥)時(shí)只需要本來1/ 12 的時(shí)間。
此后,CUDA開始受到越來越多的關(guān)注。