- 保護(hù)視力色:
CPU與GPU:誰將主導(dǎo)下一次計(jì)算革命?(上)
-
http://www.mamogu.com 發(fā)稿日期:2008-5-15
- 【搜索關(guān)鍵詞】:研究報(bào)告 投資分析 市場(chǎng)調(diào)研 CPU GPU 英特爾 NVIDIA
- 中研網(wǎng)訊:
-
2008-2009年中國IC卡行業(yè)研究咨詢報(bào)告 近幾年,中國IC卡行業(yè)步入產(chǎn)業(yè)分工合作、規(guī)模應(yīng)用起步、產(chǎn)品由低端向高端延伸發(fā)展的新階段,產(chǎn)品2008-2012年中國機(jī)械停車設(shè)備市場(chǎng)調(diào)查與發(fā)展前景 隨著我國城市尤其是大城市建設(shè)的快速發(fā)展,大量現(xiàn)代化高層建筑和住宅小區(qū)的出現(xiàn)使城市土地越發(fā)金貴2009-2010年中國激光加工設(shè)備市場(chǎng)調(diào)查與發(fā)展前景 我國激光加工產(chǎn)業(yè)規(guī)模從1990年的1200萬元,發(fā)展到2007年末的30億元,十幾年間增長了2009-2010年中國電機(jī)產(chǎn)業(yè)市場(chǎng)調(diào)查與發(fā)展前景分析 【出版日期】 2008年12月 【報(bào)告頁碼】 350頁 【圖表數(shù)量】 150面對(duì)CPU廠商染指GPU,NVIDIA也積極備戰(zhàn)。NVIDIA在2007年10月從經(jīng)營不善的處理器新興企業(yè)Stexar挖到多位“武林高手”?汕f別小瞧了Stexax,這家由原英特爾技術(shù)骨干創(chuàng)立的公司擁有多位奔騰Ⅱ、奔騰Ⅲ和奔騰Ⅳ設(shè)計(jì)團(tuán)隊(duì)的骨干,甚至還有奔騰Ⅳ中Netburst架構(gòu)的首席設(shè)計(jì)師和超線程的設(shè)計(jì)者。
3月26日,本報(bào)記者獨(dú)家專訪了NVIDIA首席科學(xué)家DavidKirk。
GPU很強(qiáng)
記者:經(jīng)過英特爾多年“Intelinside”的市場(chǎng)攻勢(shì),人們對(duì)CPU已經(jīng)很熟悉了,但對(duì)專注于圖形計(jì)算的GPU卻知之甚少。GPU與CPU有什么不同?
Kirk:長期以來,CPU一直都是單核的。CPU的設(shè)計(jì)思路是盡可能快地完成一件任務(wù);對(duì)于GPU來說,它的任務(wù)是在屏幕上合成可以高達(dá)數(shù)百萬像素的圖像——也就是說有幾百萬個(gè)任務(wù)需要并行處理。因此,GPU被設(shè)計(jì)成并行處理很多任務(wù),盡可能快地完成所有任務(wù)的總和,而不是像CPU那樣盡可能快地完成一件任務(wù)。設(shè)計(jì)GPU的體系架構(gòu)時(shí)首先考慮的是并行運(yùn)算能力,之后再考慮整型運(yùn)算和I/O吞吐能力。
多核的概念并沒有改變CPU的設(shè)計(jì)理念,也許是盡快地做兩件事或四件事,但不是并行處理很多很多任務(wù)。
記者:我看到過GPU的浮點(diǎn)性能數(shù)百倍于CPU的對(duì)比結(jié)果,卻不知兩者之間在整型計(jì)算上的比較結(jié)果。GPU只有增強(qiáng)其整型能力才能在通用計(jì)算中走得更遠(yuǎn),請(qǐng)問在整型計(jì)算上GPU有沒有補(bǔ)救措施呢?
Kirk:CPU的整數(shù)計(jì)算、分支、邏輯判斷和浮點(diǎn)運(yùn)算分別由不同的運(yùn)算單元執(zhí)行,此外還有一個(gè)浮點(diǎn)加速器。因此,CPU面對(duì)不同類型的計(jì)算任務(wù)會(huì)有不同的性能表現(xiàn)。而GPU是由同一個(gè)運(yùn)算單元執(zhí)行整數(shù)和浮點(diǎn)計(jì)算,因此,GPU的整型計(jì)算能力與其浮點(diǎn)能力相似。
我想,如果你仔細(xì)觀察一個(gè)串行程序的運(yùn)行結(jié)果,你就會(huì)發(fā)現(xiàn)與浮點(diǎn)計(jì)算能力相比,CPU的整數(shù)計(jì)算能力與GPU中流處理器的整型計(jì)算能力更接近,這是因?yàn)镃PU的設(shè)計(jì)更側(cè)重于整數(shù)計(jì)算能力。
舉例來說,一個(gè)3GHz的雙核CPU每秒能完成60億條整數(shù)指令,比如說G-80GPU,有128個(gè)1.5GHz的流處理器,每個(gè)流處理器每個(gè)計(jì)算周期可以執(zhí)行兩條整數(shù)指令,把這些數(shù)據(jù)相乘的結(jié)果大約是每秒3500億~3750億條指令,這大概是CPU運(yùn)算能力的50~100倍。
我再澄清一下,GPU在整型計(jì)算方面并沒有任何劣勢(shì)。
盡管不如在浮點(diǎn)計(jì)算方面優(yōu)勢(shì)那么大,但是GPU的整型計(jì)算能力幾乎是CPU的100倍。
記者:除了計(jì)算,CPU的另一大功能是控制。從現(xiàn)有的結(jié)構(gòu)看,GPU的控制性能要比其整型計(jì)算性能還要弱,而控制功能最終將決定GPU是否能在計(jì)算平臺(tái)上唱主角。請(qǐng)問GPU在增加和增強(qiáng)控制功能上有何設(shè)想?
Kirk:GPU同樣可以實(shí)現(xiàn)控制和分支功能。如果你有一個(gè)單線程的分支程序要運(yùn)行,你可以在CPU上運(yùn)行它。但是如果你有100萬個(gè)線程,每個(gè)線程都有分支,那么GPU的性能將遠(yuǎn)遠(yuǎn)好于CPU。我對(duì)CPU類型的計(jì)算任務(wù)并不感興趣。與其他人們想實(shí)現(xiàn)的功能相比,這項(xiàng)功能并不重要。與只有一個(gè)線程的計(jì)算任務(wù)相比,我認(rèn)為執(zhí)行與控制幾百萬個(gè)線程更為重要。當(dāng)然,CPU也能承擔(dān)這樣的任務(wù),只不過它要串行地、重復(fù)地來進(jìn)行,性能上遠(yuǎn)比不上GPU。
記者:能不能只用GPU,而不用CPU,或者說徹底拋棄CPU?
Kirk:你可以這么做,但這可能不是最佳選擇。GPU效率不高的地方在于處理單任務(wù)、單線程分支。如果你只有一項(xiàng)任務(wù),就不能充分利用GPU。因此,如果你的任務(wù)里包含各種類型的計(jì)算——任何問題都包含串行部分和并行部分——你可以在CPU上快速運(yùn)行串行部分,在GPU上運(yùn)行并行部分。我認(rèn)為這個(gè)問題的關(guān)鍵不在于競爭,而是任務(wù)的劃分。
我相信未來的計(jì)算模式是不同種類處理器的混合體。西方有一條諺語“樣樣都會(huì),行行不精”。既然CPU擅長于一種類型的計(jì)算,而GPU擅長另外一種類型的計(jì)算,那么你把它們結(jié)合在一起,相互合作,就能完成更多類型的任務(wù)。
記者:在更遠(yuǎn)的將來,有沒有可能制造沒有CPU的系統(tǒng)?
Kirk:我想這是可能的——現(xiàn)在就可能——只不過大家不想這么做。如果你想最大限度地發(fā)揮現(xiàn)有硬件的功能,你就需要各種專用處理器配合工作。我想這才是最好的解決方案。
直到有一天所有的處理器都足夠好了,你不再需要更好的計(jì)算機(jī)了,你可能選擇一個(gè)效率低一點(diǎn)但架構(gòu)更簡單的計(jì)算機(jī)。但是到目前為止,人們還是什么都想要,想要最好的串行處理器——CPU,最好的并行處理器——GPU。我想這種需求在未來很多年都不會(huì)發(fā)生改變。我認(rèn)為GPU的并行功能會(huì)越來越強(qiáng)大,而CPU也會(huì)想方設(shè)法改進(jìn)其執(zhí)行串行指令的能力。我認(rèn)為這兩項(xiàng)功能未來不會(huì)融合。
GPU在設(shè)計(jì)上有否優(yōu)勢(shì)
記者:x86CPU屬于CISC指令集。顧名思義,CISC在工藝實(shí)現(xiàn)上也同樣復(fù)雜。而GPU由于大量并行的流處理器而在工藝實(shí)現(xiàn)上整齊劃一。隨著芯片上晶體管數(shù)量的劇增和功能的增加,GPU至少在測(cè)試上比CPU更省時(shí),請(qǐng)問在制造過程中是否也具有優(yōu)勢(shì)?
Kirk:通常大家都說x86指令集有優(yōu)勢(shì),但我認(rèn)為有些情況下它是個(gè)劣勢(shì),因?yàn)樗募嫒菪允莻(gè)龐大且復(fù)雜的問題。一旦你建立起x86系統(tǒng),你只能繼續(xù)建立x86系統(tǒng)。
而我們兼容舊系統(tǒng)的壓力要小得多——不是因?yàn)槲覀兎艞壛思嫒菪裕俏覀儧]有那么長的歷史需要兼容——這在效率上帶給我們一些優(yōu)勢(shì)。
除了你提到的測(cè)試,我認(rèn)為還有一種很重要的考察效率的指標(biāo),這就是每平方毫米硅片所貢獻(xiàn)的性能。因?yàn)镚PU擁有更直截了當(dāng)?shù)闹噶罴,其設(shè)計(jì)更先進(jìn),GPU上每個(gè)晶體管的平均性能要比CPU的更高。
記者:5年前我獨(dú)家專訪過英特爾CTO基辛格。在談?wù)摚梗埃睿碇圃旃に嚂r(shí),他告訴我,英特爾真正的核心競爭力是設(shè)計(jì)與制造這兩個(gè)階段的雙向優(yōu)化。如今,半導(dǎo)體制造工藝已經(jīng)進(jìn)入45nm留給各自獨(dú)立的Fabless(無生產(chǎn)線芯片制造商)和Foundry(標(biāo)準(zhǔn)工藝制造商)之間的工藝冗余度越來越小。未來,你們與合作伙伴臺(tái)積電如何應(yīng)對(duì)這一挑戰(zhàn)?
Kirk:首先我得指出,每個(gè)處于帕特·基辛格先生位置的人當(dāng)然都會(huì)像他這么說。他總是把自己的公司說得很好。盡管我們和Foundry不是同一家企業(yè),但我們之間密切合作,彼此之間做了優(yōu)化。我不認(rèn)為在這一點(diǎn)上有任何區(qū)別。
記者:你們做同樣的事?
Kirk:是的,我們必須這么做,否則我們就沒有競爭力。
記者:你對(duì)未來GPU在制造上有何展望?
Kirk:我認(rèn)為前景很光明。每跨入新一代設(shè)計(jì)尺寸當(dāng)然意味著更復(fù)雜的設(shè)計(jì)和更大的精力投入,但這就是我們的工作,我們必須這么做,就像英特爾一樣。
CPU與GPU:融合還是集成
記者:回顧CPU的發(fā)展,由于集成了數(shù)學(xué)協(xié)處理器,Intel80486顯著提升了浮點(diǎn)計(jì)算的性能,后來由于集成了MMX等多媒體指令集,使得PentiumMMX的多媒體性能得以增強(qiáng)。NVIDIA也在2005年推出單芯片的芯片組+GPU產(chǎn)品C51。這些都是PC平臺(tái)上SOC趨勢(shì)的具體表現(xiàn)。請(qǐng)問你是如何評(píng)價(jià)CPU與GPU集成的?
Kirk:集成只是縮減成本的一種途徑,而非提高性能或增強(qiáng)功能的良方。所以,CPU和GPU的集成對(duì)于低端或內(nèi)嵌應(yīng)用來說比較合理,因?yàn)檫@些領(lǐng)域需要控制成本,便攜式設(shè)備、手機(jī)和筆記本電腦亦然。而對(duì)于高端應(yīng)用或條件要求苛刻的應(yīng)用來說,計(jì)算能力的不足意味著你無須集成,相反,你要做的是分解,通過更多的CPU和GPU來獲得更強(qiáng)的計(jì)算能力,而不是更小的CPU和GPU。
記者:但SOC是未來趨勢(shì)?
Kirk:我不這么認(rèn)為。我們距離最完美的圖形還有很長的距離。在準(zhǔn)備在高端應(yīng)用中進(jìn)行圖形集成之前,我們還應(yīng)做得更好,要走的路還很長。
記者:NVIDIA從Stexar公司挖到了一批前英特爾奔騰4的骨干。在CPU廠商頻頻染指GPU時(shí),你們不會(huì)讓這些CPU的頂尖高手改行從事GPU的設(shè)計(jì)吧?
Kirk:就我們是否會(huì)生產(chǎn)CPU這個(gè)問題,我并不想做什么預(yù)測(cè),實(shí)際上,我并不認(rèn)為CPU有那么的重要。我深信,GPU距離完美還有很長的距離而CPU已接近完美。隨著時(shí)間的推移,CPU的大小已變得沒那么重要了。這樣看來,現(xiàn)在或許是CPU實(shí)現(xiàn)集成的最佳時(shí)機(jī)。我想問的是,既然我們實(shí)施了在北橋芯片中集成圖形功能的策略,又為何不集成CPU呢?這么小的東西集成起來會(huì)更方便。
- ■ 與【CPU與GPU:誰將主導(dǎo)下一次計(jì)算革命?(上)】相關(guān)新聞
- ■ 行業(yè)經(jīng)濟(jì)
- ■ 經(jīng)濟(jì)指標(biāo)
-
- ·2008年1-11月浙江起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
- ·2008年1-11月江蘇起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
- ·2008年1-11月安徽起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
- ·2008年1-11月山東起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
- ·2008年1-11月河南起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
- ·2008年1-11月湖北起重運(yùn)輸設(shè)備制造主要經(jīng)濟(jì)指標(biāo)
-