目前,谷歌、Facebook、微軟、Twitter和百度等互聯(lián)網(wǎng)巨頭,都在使用這種叫做GPU的芯片,讓服務(wù)器學(xué)習(xí)海量的照片、視頻、聲音文檔,以及社交媒體上的信息,來改善搜索和自動(dòng)化照片標(biāo)記等各種各樣的軟件功能。一些汽車制造商也在利用這項(xiàng)技術(shù),開發(fā)可以感知周圍環(huán)境、避開危險(xiǎn)區(qū)域的無人駕駛汽車。
除了在GPU和圖形計(jì)算領(lǐng)域長(zhǎng)期領(lǐng)先,英偉達(dá)也是最早一批在人工智能領(lǐng)域進(jìn)行投資的科技公司。2008年,當(dāng)時(shí)在斯坦福做研究的吳恩達(dá)發(fā)表了一篇用GPU上的CUDA進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練的論文。2012年“深度學(xué)習(xí)三巨頭”之一Geoff Hilton的學(xué)生Alex Krizhevsky用英偉達(dá)的GeForce顯卡在ImageNet中將圖像識(shí)別準(zhǔn)確率大幅提升,這也是英偉達(dá)CEO黃仁勛時(shí)常提到的英偉達(dá)注重深度學(xué)習(xí)的開端。
有報(bào)告顯示,世界上目前約有3000多家AI初創(chuàng)公司,大部分都采用了Nvidia提供的硬件平臺(tái)。
“深度學(xué)習(xí)被證明是非常有效的。”黃仁勛在季報(bào)2月10日的發(fā)布會(huì)中表示。在列舉目前GPU計(jì)算平臺(tái)正在人工智能、云計(jì)算、游戲和自動(dòng)駕駛領(lǐng)域快速展開應(yīng)用的同時(shí),黃仁勛表示,在未來數(shù)年間,深度學(xué)習(xí)將會(huì)成為計(jì)算機(jī)計(jì)算的一種基礎(chǔ)性的核心工具。
AMD和Intel巨頭的AI演變
投資者和芯片制造商關(guān)注著所有互聯(lián)網(wǎng)巨頭的一舉一動(dòng)。僅僅以英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)為例,在很長(zhǎng)一段時(shí)間以來,該公司一直為谷歌提供數(shù)據(jù)服務(wù)。
英偉達(dá)并非GPU的唯一領(lǐng)先者,巨頭Intel和AMD都在這一領(lǐng)域有著不同的優(yōu)勢(shì)。
2016年11月,Intel公司發(fā)布了一個(gè)叫做Nervana的AI處理器,他們宣稱會(huì)在明年年中測(cè)試這個(gè)原型。如果一切進(jìn)展順利,Nervana芯片的最終形態(tài)會(huì)在2017年底面世。這個(gè)芯片名稱基于Intel早前購買的一個(gè)叫做Nervana的公司。按照Intel的人所說,這家公司是世界上第一家專門為AI打造芯片的公司。
Intel公司披露了一些關(guān)于這個(gè)芯片的一些細(xì)節(jié),按照他們所說,這個(gè)項(xiàng)目代碼為“Lake Crest”,將會(huì)用到Nervana Engine 和Neon DNN相關(guān)軟件。這款芯片可以加速各類神經(jīng)網(wǎng)絡(luò),例如谷歌TensorFlow框架。
芯片由所謂的“處理集群”陣列構(gòu)成,處理被稱作“活動(dòng)點(diǎn)”的簡(jiǎn)化數(shù)學(xué)運(yùn)算。相對(duì)于浮點(diǎn)運(yùn)算,這種方法所需的數(shù)據(jù)量更少,因此帶來了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大、速度更快的集群,其拓?fù)浣Y(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大、更多元化的神經(jīng)網(wǎng)絡(luò)模型。這一數(shù)據(jù)連接中包含12個(gè)100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換。
TPU與FPGA可能的逆襲
在上述芯片巨頭進(jìn)行GPU領(lǐng)域的提升之外,有更多的企業(yè)在試圖引發(fā)一輪全面的顛覆。其代表為谷歌在2016年宣布將獨(dú)立開發(fā)一種名為TPU的全新的處理系統(tǒng)。
TPU是專門為機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計(jì)的專用芯片。通過降低芯片的計(jì)算精度,減少實(shí)現(xiàn)每個(gè)計(jì)算操作所需的晶體管數(shù)量,從而能讓芯片的每秒運(yùn)行的操作個(gè)數(shù)更高,這樣經(jīng)過精細(xì)調(diào)優(yōu)的機(jī)器學(xué)習(xí)模型就能在芯片上運(yùn)行得更快,進(jìn)而更快地讓用戶得到更智能的結(jié)果。Google將TPU加速器芯片嵌入電路板中,利用已有的硬盤PCI-E接口接入數(shù)據(jù)中心服務(wù)器中。
據(jù)Google 資深副總裁Urs Holzle 透露,當(dāng)前Google TPU、GPU 并用,這種情況仍會(huì)維持一段時(shí)間,但他表示,GPU 可執(zhí)行繪圖運(yùn)算工作,用途多元;TPU 屬于ASIC,也就是專為特定用途設(shè)計(jì)的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快,但缺點(diǎn)是成本較高。
除了上述提到的谷歌,微軟也在使用一種叫做現(xiàn)場(chǎng)可變編程門陣列(FPGA)的新型處理器。
據(jù)介紹,這個(gè)FPGA 目前已支持微軟Bing,未來它們將會(huì)驅(qū)動(dòng)基于深度神經(jīng)網(wǎng)絡(luò)——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,在執(zhí)行這個(gè)人工智能的幾個(gè)命令時(shí),速度比普通芯片快上幾個(gè)數(shù)量級(jí)。有了它,你的計(jì)算機(jī)屏幕只會(huì)空屏23毫秒而不是4秒。
在第三代原型中,芯片位于每個(gè)服務(wù)器的邊緣,直接插入到網(wǎng)絡(luò),但仍舊創(chuàng)造任何機(jī)器都可接入的FPGA池。這開始看起來是Office 365可用的東西了。最終,Project Catapult準(zhǔn)備好上線了。另外,Catapult硬件的成本只占了服務(wù)器中所有其它的配件總成本的30%,需要的運(yùn)轉(zhuǎn)能量也只有不到10%,但其處理速度卻是原來的2倍。
此外,有一些公司,例如Nervada和Movidius,模擬GPU的平行模式,但是專注于更快速地移動(dòng)數(shù)據(jù),省略圖像所需要的功能。其他公司,包括使用了被稱為“True North”的芯片的IBM公司,開發(fā)了由神經(jīng)元、突觸等其他大腦特征所啟發(fā)的芯片設(shè)計(jì)。 2/3 首頁 上一頁 1 2 3 下一頁 尾頁 |