400-638-8808
|
微信公眾號(hào)








穩(wěn)定可靠 永不間斷

海外收發(fā) 暢通無(wú)阻

協(xié)同辦公 資源管理

超大郵件 超級(jí)功能

智能反垃圾郵件技術(shù)
易管理 免維護(hù)

微信掃一掃 關(guān)注"天下數(shù)據(jù)"商品一律九折
![]()
搜索"朗玥科技"關(guān)注,了解最新優(yōu)惠

在GPU出現(xiàn)以前,顯卡和CPU的關(guān)系有點(diǎn)像“主仆”,簡(jiǎn)單地說(shuō)這時(shí)的顯卡就是畫筆,根據(jù)各種有CPU發(fā)出的指令和數(shù)據(jù)進(jìn)行著色,材質(zhì)的填充、渲染、輸出等。
較早的娛樂(lè)用的3D顯卡又稱“3D加速卡”,由于大部分坐標(biāo)處理的工作及光影特效需要由CPU親自處理,占用了CPU太多的運(yùn)算時(shí)間,從而造成整體畫面不能非常流暢地表現(xiàn)出來(lái)。
例如,渲染一個(gè)復(fù)雜的三維場(chǎng)景,需要在一秒內(nèi)處理幾千萬(wàn)個(gè)三角形頂點(diǎn)和光柵化幾十億的像素。早期的3D游戲,顯卡只是為屏幕上顯示像素提供一個(gè)緩存,所有的圖形處理都是由CPU單獨(dú)完成。圖形渲染適合并行處理,擅長(zhǎng)于執(zhí)行串行工作的CPU實(shí)際上難以勝任這項(xiàng)任務(wù)。所以,那時(shí)在PC上實(shí)時(shí)生成的三維圖像都很粗糙。不過(guò)在某種意義上,當(dāng)時(shí)的圖形繪制倒是完全可編程的,只是由CPU來(lái)?yè)?dān)綱此項(xiàng)重任,速度上實(shí)在是達(dá)不到要求。
隨著時(shí)間的推移,CPU進(jìn)行各種光影運(yùn)算的速度變得越來(lái)越無(wú)法滿足游戲開(kāi)發(fā)商的要求,更多多邊形以及特效的應(yīng)用榨干了幾乎所有的CPU性能,矛盾產(chǎn)生了······
GPU的誕生
NVIDIA公司在1999年8月31日發(fā)布GeForce 256圖形處理芯片時(shí)首先提出GPU的概念。
GPU之所以被稱為圖形處理器,最主要的原因是因?yàn)樗梢赃M(jìn)行幾乎全部與計(jì)算機(jī)圖形有關(guān)的數(shù)據(jù)運(yùn)算,而這些在過(guò)去是CPU的專利。
目前,計(jì)算機(jī)圖形學(xué)正處于前所未有的發(fā)展時(shí)期。近年來(lái),GPU技術(shù)以令人驚異的速度在發(fā)展。渲染速率每6個(gè)月就翻一番。性能自99年,多年來(lái)翻番了十倍百倍,也就是(2的10次方比2)提高了上千倍!與此同時(shí),不僅性能得到了提高,計(jì)算質(zhì)量和圖形編程的靈活性也逐漸得以改善。
以前,PC和計(jì)算機(jī)工作站只有圖形加速器,沒(méi)有圖形處理器(GPU),而圖形加速器只能簡(jiǎn)單的加速圖形渲染。而GPU取代了圖形加速器之后,我們就應(yīng)該摒棄圖形加速器的舊觀念。
GPU的結(jié)構(gòu)
GPU全稱是Graphic Processing Unit--圖形處理器,其最大的作用就是進(jìn)行各種繪制計(jì)算機(jī)圖形所需的運(yùn)算,包括頂點(diǎn)設(shè)置、光影、像素操作等。GPU實(shí)際上是一組圖形函數(shù)的集合,而這些函數(shù)由硬件實(shí)現(xiàn)。以前,這些工作都是有CPU配合特定軟件進(jìn)行的,GPU從某種意義上講就是為了在圖形處理過(guò)程中充當(dāng)主角而出現(xiàn)的。
一個(gè)簡(jiǎn)單的GPU結(jié)構(gòu)示意圖包含一塊標(biāo)準(zhǔn)的GPU主要包括2D Engine、3D Engine、VideoProcessing Engine、FSAA Engine、顯存管理單元等。其中,3D運(yùn)算中起決定作用的是3DEngine,這是現(xiàn)代3D顯卡的靈魂,也是區(qū)別GPU等級(jí)的重要標(biāo)志。3DEngine在各公司的產(chǎn)品中都是宣傳攻勢(shì)的重點(diǎn)照顧對(duì)象,名字一個(gè)比一個(gè)響,像NVIDIA的nFjnjtFX系列、CineFX系列,AMD的SmoothVision系列。一個(gè)3DEngine通常包含著T&L單元、VertexProeessingEngine、SetupEngine、PiexlShader等部分。
GPU的工作原理
GPU中數(shù)據(jù)的處理流程

GPU流程示意圖
現(xiàn)在讓我們來(lái)看看第二代GPU是如何完整處理一個(gè)畫面的吧!首先,來(lái)自CPU的各種物理參數(shù)進(jìn)入GPU,Vertex shader將對(duì)頂點(diǎn)數(shù)據(jù)進(jìn)行基本的判斷。如果沒(méi)有需要處理的Vertex 效果,則頂點(diǎn)數(shù)據(jù)直接進(jìn)入T&L Unit 進(jìn)行傳統(tǒng)的T&L操作以節(jié)約時(shí)間提高效率。如果需要處理各種Vertex 效果,則Vertex shader將先對(duì)各種Vertex Programs的指令進(jìn)行運(yùn)算,一般的Vertex Programs中往往包含了過(guò)去轉(zhuǎn)換、剪切、光照運(yùn)算等所需要實(shí)現(xiàn)的效果,故經(jīng)由Vertex shader處理的效果一般不需要再進(jìn)行T&L操作。另外,當(dāng)遇到涉及到曲面鑲嵌(把曲面,比如弓形轉(zhuǎn)換成為多邊形或三角形)的場(chǎng)合時(shí)。CPU可以直接將數(shù)據(jù)交給Vertex shader進(jìn)行處理。
另外,在DireetX的Transform過(guò)程中,Vertex shader可以完成Z值的剔除,也就是Back Face Culling――陰面隱去。這就意味粉除了視野以外的頂點(diǎn),視野內(nèi)坡前面項(xiàng)點(diǎn)遮住的頂點(diǎn)也會(huì)被一并剪除,這大大減輕了需要進(jìn)行操作的頂點(diǎn)數(shù)目。
接下來(lái),經(jīng)由VertexShader處理完成的各種數(shù)據(jù)將流入SetupEngine,在這里,運(yùn)算單元將進(jìn)行三角形的設(shè)置工作,這是整個(gè)繪圖過(guò)程中最重要的一個(gè)步驟,Setup Engine甚至直接影響著一塊GPU的執(zhí)行效能。三角形的設(shè)置過(guò)程是由一個(gè)個(gè)多邊形組成的,或者是用更好的三角形代替原來(lái)的三角形。在三維圖象中可能會(huì)有些三角形被它前面的三角形擋住,但是在這個(gè)階段3D芯片還不知道哪些三角形會(huì)被擋住,所以三角形建立單元接收到是一個(gè)個(gè)由3個(gè)頂點(diǎn)組成的完整三角形。三角形的每個(gè)角(或頂點(diǎn))都有對(duì)應(yīng)的X軸、Y軸、Z軸坐標(biāo)值,這些坐標(biāo)值確定了它們?cè)?D景物中的位置。同時(shí),三角形的設(shè)置也確定了像素填充的范圍。,至此,VertexShader的工作就完成了。
過(guò)去[第一代],設(shè)置好的三角形本來(lái)應(yīng)該帶著各自所有的參數(shù)進(jìn)入像素流水線內(nèi)進(jìn)行紋理填充和演染,但現(xiàn)在則不同,在填充之前我們還播要進(jìn)行PiexlShader的操作。其實(shí),PieXIShader并非獨(dú)立存在的,它位于紋理填充單元之后,數(shù)據(jù)流入像紊流水線后先進(jìn)入紋理填充單元進(jìn)行紋理填充,然后便是Piex!Shader單元,經(jīng)由PiexlShader單元進(jìn)行各種處理運(yùn)算之后再進(jìn)入像素填充單元進(jìn)行具體的粉色,再經(jīng)由霧化等操作后,一個(gè)完整的畫面就算完成了。值得注意的是,第二代GPU中普遮引入了獨(dú)立的顯示數(shù)據(jù)管理機(jī)制,它們位于VertexShader、SetuPEngine以及像素流水線之間,負(fù)資數(shù)據(jù)更有效率地傳輸和組合、各種無(wú)效值的剔除、數(shù)據(jù)的壓縮以及寄存器的管理等工作,這個(gè)單元的出現(xiàn)對(duì)整個(gè)GPU工作效率的保證起到了至關(guān)重要的作用。
簡(jiǎn)而言之,GPU的圖形(處理)流水線完成如下的工作:(并不一定是按照如下順序)
頂點(diǎn)處理:這階段GPU讀取描述3D圖形外觀的頂點(diǎn)數(shù)據(jù)并根據(jù)頂點(diǎn)數(shù)據(jù)確定3D圖形的形狀及位置關(guān)系,建立起3D圖形的骨架。在支持DX系列規(guī)格的GPU中,這些工作由硬件實(shí)現(xiàn)的Vertex Shader(定點(diǎn)著色器)完成。
光柵化計(jì)算:顯示器實(shí)際顯示的圖像是由像素組成的,我們需要將上面生成的圖形上的點(diǎn)和線通過(guò)一定的算法轉(zhuǎn)換到相應(yīng)的像素點(diǎn)。把一個(gè)矢量圖形轉(zhuǎn)換為一系列像素點(diǎn)的過(guò)程就稱為光柵化。例如,一條數(shù)學(xué)表示的斜線段,最終被轉(zhuǎn)化成階梯狀的連續(xù)像素點(diǎn)。
紋理帖圖:頂點(diǎn)單元生成的多邊形只構(gòu)成了3D物體的輪廓,而紋理映射(texture mapping)工作完成對(duì)多變形表面的帖圖,通俗的說(shuō),就是將多邊形的表面貼上相應(yīng)的圖片,從而生成“真實(shí)”的圖形。TMU(Texture mapping unit)即是用來(lái)完成此項(xiàng)工作。
像素處理:這階段(在對(duì)每個(gè)像素進(jìn)行光柵化處理期間)GPU完成對(duì)像素的計(jì)算和處理,從而確定每個(gè)像素的最終屬性。在支持DX8和DX9規(guī)格的GPU中,這些工作由硬件實(shí)現(xiàn)的Pixel Shader(像素著色器)完成。
最終輸出:由ROP(光柵化引擎)最終完成像素的輸出,1幀渲染完畢后,被送到顯存幀緩沖區(qū)。
總結(jié):GPU的工作通俗的來(lái)說(shuō)就是完成3D圖形的生成,將圖形映射到相應(yīng)的像素點(diǎn)上,對(duì)每個(gè)像素進(jìn)行計(jì)算確定最終顏色并完成輸出。
CPU與GPU的數(shù)據(jù)處理關(guān)系
如今的顯卡圖形,單單從圖象的生成來(lái)說(shuō)大概需要下面四個(gè)步驟:
1、Homogeneouscoordinates(齊次坐標(biāo))
2、Shadingmodels(陰影建模)
3、Z-Buffering(Z-緩沖)
4、Texture-Mapping(材質(zhì)貼圖)
在這些步驟中,顯示部分(GPU)只負(fù)責(zé)完成第三、四步,而前兩個(gè)步驟主要是依靠 CPU 來(lái)完成。而且,這還僅僅只是3D圖象的生成,還沒(méi)有包括圖形中復(fù)雜的AI運(yùn)算。場(chǎng)景切換運(yùn)算等等……無(wú)疑,這些元素還需要CPU去完成。
接下來(lái),讓我們簡(jiǎn)單的看一下CPU和GPU之間的數(shù)據(jù)是如何交互的。
首先從硬盤中讀取模型, CPU分類后將多邊形信息交給GPU,GPU再時(shí)時(shí)處理成屏幕上可見(jiàn)的多邊形,但是沒(méi)有紋理只有線框。
模型出來(lái)后,GPU將模型數(shù)據(jù)放進(jìn)顯存,顯卡同時(shí)也為模型貼材質(zhì),給模型上顏色。CPU相應(yīng)從顯存中獲取多邊形的信息。然后CPU計(jì)算光照后產(chǎn)生的影子的輪廓。等CPU計(jì)算出后,顯卡的工作又有了,那就是為影子中填充深的顏色
這一點(diǎn)要注意的是,無(wú)論多牛的顯卡,光影都是CPU計(jì)算的,GPU只有2個(gè)工作,1多邊形生成。2為多邊形上顏色。
傳統(tǒng)GPU指令的執(zhí)行
傳統(tǒng)的GPU基于SIMD的架構(gòu)。SIMD即SingleInstruction Multiple Data,單指令多數(shù)據(jù)。其實(shí)這很好理解,傳統(tǒng)的VS和PS中的ALU(算術(shù)邏輯單元,通常每個(gè)VS或PS中都會(huì)有一個(gè)ALU,但這不是一定的)都能夠在一個(gè)周期內(nèi)(即同時(shí))完成對(duì)矢量4個(gè)通道的運(yùn)算。比如執(zhí)行一條4D指令,PS或VS中的ALU對(duì)指令對(duì)應(yīng)定點(diǎn)和像素的4個(gè)屬性數(shù)據(jù)都進(jìn)行了相應(yīng)的計(jì)算。這便是SIMD的由來(lái)。這種ALU我們暫且稱它為4DALU。
需要注意的是,4D SIMD架構(gòu)雖然很適合處理4D指令,但遇到1D指令的時(shí)候效率便會(huì)降為原來(lái)的1/4。此時(shí)ALU 3/4的資源都被閑置。為了提高PS VS執(zhí)行1D 2D 3D指令時(shí)的資源利用率,DirectX9時(shí)代的GPU通常采用1D+3D或2D+2DALU。這便是Co-issue技術(shù)。這種ALU對(duì)4D指令的計(jì)算時(shí)仍然效能與傳統(tǒng)的ALU相同,但當(dāng)遇到1D 2D 3D指令時(shí)效率則會(huì)高不少,例如如下指令:
ADD R0.xyz , R0,R1 //此指令是將R0,R1矢量的x,y,z值相加 結(jié)果賦值給R0
ADD R3.x , R2,R3 //此指令是將R2 R3矢量的w值相加 結(jié)果賦值給R3
對(duì)于傳統(tǒng)的4D ALU,顯然需要兩個(gè)周期才能完成,第一個(gè)周期ALU利用率75% ,第二個(gè)周期利用率25%。而對(duì)于1D+3D的ALU,這兩條指令可以融合為一條4D指令,因而只需要一個(gè)周期便可以完成,ALU利用率100%。 當(dāng)然,即使采用co-issue,ALU利用率也不可能總達(dá)到100%,這涉及到指令并行的相關(guān)性等問(wèn)題,而且,更直觀的,上述兩條指令顯然不能被2D+2DALU一周期完成,而且同樣,兩條2D指令也不能被1D+3DALU一周期完成。傳統(tǒng)GPU在對(duì)非4D指令的處理顯然不是很靈活。
GPU的多線程及并行計(jì)算
GPU的功能更新很迅速,平均每一年多便有新一代的GPU誕生,運(yùn)算速度也越來(lái)越快。GPU的運(yùn)算速度如此之快,主要得益于GPU是對(duì)圖形實(shí)時(shí)渲染量身定制的,具有兩點(diǎn)主要特征:超長(zhǎng)流水線與并行計(jì)算。
多線程機(jī)制
GPU的執(zhí)行速度很快,但是當(dāng)運(yùn)行從內(nèi)存中獲取紋理數(shù)據(jù)這樣的指令時(shí)(由于內(nèi)存訪問(wèn)是瓶頸,此操作比較緩慢),整個(gè)流水線便出現(xiàn)長(zhǎng)時(shí)間停頓。在CPU內(nèi)部,使用多級(jí)Cache來(lái)提高訪問(wèn)內(nèi)存的速度。GPU中也使用Cache,不過(guò)Cache命中率不高,只用Cache解決不了這個(gè)問(wèn)題。所以,為了保持流水線保持忙碌,GPU的設(shè)計(jì)者使用了多線程機(jī)制(multi-threading)。當(dāng)像素著色器針對(duì)某個(gè)像素的線程A遇到存取紋理的指令時(shí),GPU會(huì)馬上切換到另外一個(gè)線程B,對(duì)另一個(gè)像素進(jìn)行處理。等到紋理從內(nèi)存中取回時(shí),可再切換到線程A。
例如:如果裝配一臺(tái)汽車需要,10個(gè)時(shí)間單元,將它分成10個(gè)流水線階段,每個(gè)階段分配一個(gè)時(shí)間單元,那么一條裝配線每一個(gè)時(shí)間單元就可以生產(chǎn)一輛汽車。顯然流水線模式的生產(chǎn)在理想狀況下要比串行方式快了十倍。
但是使用這種方法有一個(gè)前提,線程A與線程B沒(méi)有數(shù)據(jù)依賴性,也就是說(shuō)兩線程之間無(wú)需通訊。如果線程B需要線程A提供某些數(shù)據(jù),那么即使切換到線程B,線程B仍是無(wú)法運(yùn)行,流水線還是處于空閑狀態(tài)。不過(guò)幸運(yùn)的是,圖形渲染本質(zhì)上是一個(gè)并行任務(wù)。

并行計(jì)算
無(wú)論是CPU送給GPU的頂點(diǎn)數(shù)據(jù),還是GPU光柵生成器產(chǎn)生的像素?cái)?shù)據(jù)都是互不相關(guān)的,可以并行地獨(dú)立處理。而且頂點(diǎn)數(shù)據(jù)(xyzw),像素?cái)?shù)據(jù)(RGBA)一般都用四元數(shù)表示,適合于并行計(jì)算。在GPU中專門設(shè)置了SIMD指令來(lái)處理向量,一次可同時(shí)處理四路數(shù)據(jù)。SIMD指令使用起來(lái)非常簡(jiǎn)潔。此外,紋理片要么只能讀取,要么只能寫入,不允許可讀可寫,從而解決了存貯器訪問(wèn)的讀寫沖突。GPU這種對(duì)內(nèi)存使用的約束也進(jìn)一步保證了并行處理的順利完成。
為了進(jìn)一步提高并行度,可以增加流水線的條數(shù)。在GPU中,有多達(dá)16組像素著色器流水線,6組頂點(diǎn)著色器流水線。多條流水線可以在單一控制部件的集中控制下運(yùn)行,也可以獨(dú)立運(yùn)行。在單指令多數(shù)據(jù)流(SIMD)的結(jié)構(gòu)中,GPU通過(guò)單指令多數(shù)據(jù)(SIMD)指令類型來(lái)支持?jǐn)?shù)據(jù)并行計(jì)算。在單指令多數(shù)據(jù)流的結(jié)構(gòu)中,單一控制部件向每條流水線分派指令,同樣的指令被所有處理部件同時(shí)執(zhí)行。例如NVIDIA顯卡中包含有14組多處理器(MultiProcessor),每組處理器有8個(gè)處理單元(Processor),但每組多處理器只包含一個(gè)指令單元(InstruetionUnit)。

另外一種控制結(jié)構(gòu)是多指令多數(shù)據(jù)流(MIMD),每條流水線都能夠獨(dú)立于其他流水線執(zhí)行不同的程序。顯卡的頂點(diǎn)著色器流水線使用MIMD方式控制,像素著色器流水線使用SIMD結(jié)構(gòu)。MIMD能比較有效率地執(zhí)行分支程序,而SIMD體系結(jié)構(gòu)運(yùn)行條件語(yǔ)句時(shí)會(huì)造成很低的資源利用率。不過(guò)SIMD需要硬件少,這是一個(gè)優(yōu)勢(shì)。
CPU中大部分晶體管主要用于構(gòu)建控制電路(象分支預(yù)測(cè)等)和Cache,只有少部分的晶體管來(lái)完成實(shí)際的運(yùn)算工作。而GPU的控制相對(duì)簡(jiǎn)單,而且對(duì)Cache的需求小,所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計(jì)算速度有了突破性的飛躍,擁有了驚人的處理浮點(diǎn)運(yùn)算的能力,F(xiàn)在CPU的技術(shù)進(jìn)步正在慢于摩爾定律,而GPU(視頻卡上的圖形處理器)的運(yùn)行速度已超過(guò)摩爾定律,每6個(gè)月其性能加倍。
GPU未來(lái)的展望
GPU能否包辦一切
無(wú)論是電影畫面的離線渲染、地球物理學(xué)數(shù)據(jù)處理,還是水庫(kù)建模,這些運(yùn)算原本都應(yīng)該由CPU完成,那么 GPU有沒(méi)有可能包辦一切呢?
答案是肯定的。DirectX新技術(shù)和統(tǒng)一Shader架構(gòu)的出現(xiàn),讓GPU在可編程性上有了大幅度的提升。不僅如此,飛速發(fā)展的制造工藝令 GPU 可以整合更多的晶體管,實(shí)現(xiàn)更多的功能。目前的GPU,已經(jīng)可以幫助CPU進(jìn)行對(duì)高清視頻的完全硬解碼,雖然是通過(guò)加入了專門的處理單元,但其意義已經(jīng)足以說(shuō)明 GPU在未來(lái)的計(jì)算領(lǐng)域,將會(huì)有一番大作為,位置從CPU的從屬,轉(zhuǎn)變?yōu)橹鲗?dǎo)。
GPU時(shí)代即將到來(lái)
隨著 CUDA 的進(jìn)一步開(kāi)發(fā)和完善,GPU 的運(yùn)算能力也將得到進(jìn)一步的強(qiáng)化。目前的 CUDA和GPU的配合還處于起步階段,正在真正的民用市場(chǎng)逐步起步。而且,利用GPU進(jìn)行高性能計(jì)算的門檻很低,只要有一片 Quadro或 GeForce 系列顯卡,就能夠進(jìn)行高性能計(jì)算,一些研究人員也已經(jīng)開(kāi)始使用CUDA,利用 GPU數(shù)倍于CPU的浮點(diǎn)運(yùn)算能力,進(jìn)行各種各樣的科學(xué)模擬、運(yùn)算。CUDA 的推出對(duì)于通用計(jì)算領(lǐng)域無(wú)疑是一個(gè)革命性的改變,而 GPU 的實(shí)際功能也會(huì)隨著CUDA 的完善而變革。也許在不遠(yuǎn)的將來(lái),因?yàn)镃UDA的存在,CPU的運(yùn)算功能將會(huì)不斷淡化,GPU的時(shí)代即將到來(lái)。
【后記】
CPU第一個(gè)整合的就是專門用來(lái)加速浮點(diǎn)運(yùn)算的協(xié)處理器,此后歷代SSE指令集也都是為了加強(qiáng)CPU的SIMD(單指令多數(shù)據(jù)流)浮點(diǎn)運(yùn)算性能。而GPU打從一開(kāi)始就被設(shè)計(jì)成為了SIMD架構(gòu)(至今Cypress也還是這種架構(gòu)),擁有恐怖浮點(diǎn)運(yùn)算能力的處理器。當(dāng)今GPU的浮點(diǎn)運(yùn)算能力更是達(dá)到多核CPU的幾十倍甚至上百倍!
CPU永遠(yuǎn)都趕不上GPU的發(fā)展速度,因此最適合進(jìn)行浮點(diǎn)運(yùn)算的顯然是GPU,CPU繼續(xù)擴(kuò)充核心數(shù)目已經(jīng)變得毫無(wú)意義,因此整個(gè)業(yè)界都在想方設(shè)法的發(fā)掘GPU的潛能,將所有的并行計(jì)算任務(wù)都轉(zhuǎn)移到GPU上面來(lái)。即便是Intel也看到了GPU廣闊的前景,因此著手研發(fā)GPU。
GPU從誕生至今一步步走來(lái),就是在不斷蠶食著原本屬于CPU的功能,或者說(shuō)是幫助CPU減負(fù)、去處理哪些CPU并不擅長(zhǎng)的任務(wù)。比如最開(kāi)始的T&L(坐標(biāo)轉(zhuǎn)換與光源)、VCD\DVD\HD\BD視頻解碼、物理加速、幾何著色。而今后和未來(lái),GPU將奪走一項(xiàng)CPU最重要的功能——并行計(jì)算、高精度浮點(diǎn)運(yùn)算。
AMD和Intel都已推出CPU整合GPU的產(chǎn)品,不管是膠水還是原生的解決方案,其目的并不是為了消滅顯卡和GPU,而是通過(guò)內(nèi)置的GPU為CPU提供強(qiáng)大的浮點(diǎn)運(yùn)算能力。但由于制造工藝所限,被CPU所整合的GPU不是集成卡就是中低端,只能滿足基本需求。所以想要更強(qiáng)大的性能和并行計(jì)算性能的話,專為浮點(diǎn)運(yùn)算而設(shè)計(jì)的新一代架構(gòu)的GPU產(chǎn)品,才是最明智的選擇。
所以說(shuō),CPU和GPU,誰(shuí)也不可能取代誰(shuí),雙方是互補(bǔ)的關(guān)系,只有CPU和GPU協(xié)同運(yùn)算,各自去處理最擅長(zhǎng)的任務(wù),才能發(fā)揮出計(jì)算機(jī)最強(qiáng)的效能。CPU會(huì)整合GPU的,但僅限中低端產(chǎn)品;GPU會(huì)取代CPU進(jìn)行浮點(diǎn)運(yùn)算的,但它仍然需要CPU來(lái)運(yùn)行操作系統(tǒng)并控制整個(gè)計(jì)算機(jī)。只有當(dāng)制造工藝發(fā)達(dá)到一定程度時(shí)才有可能將CPU和GPU完美融合在一起,到時(shí)候是CPU整合GPU還是GPU整合CPU都很難說(shuō),但誰(shuí)被誰(shuí)整合已經(jīng)不重要了。
本文來(lái)源:啃芝士
需要人工智能服務(wù)器、AI服務(wù)器、GPU服務(wù)器、FPGA云服務(wù)器等詳詢天下數(shù)據(jù)客服電話400-638-8808 官網(wǎng):m.51huadong.com。
產(chǎn)品與服務(wù)
香港服務(wù)器 香港高防服務(wù)器 美國(guó)服務(wù)器 韓國(guó)服務(wù)器 新加坡服務(wù)器 日本服務(wù)器 臺(tái)灣服務(wù)器云服務(wù)器
香港云主機(jī) 美國(guó)云主機(jī) 韓國(guó)云主機(jī) 新加坡云主機(jī) 臺(tái)灣云主機(jī) 日本云主機(jī) 德國(guó)云主機(jī) 全球云主機(jī)高防專線
海外高防IP 海外無(wú)限防御 SSL證書 高防CDN套餐 全球節(jié)點(diǎn)定制 全球?qū)>GPLC關(guān)于我們
關(guān)于天下數(shù)據(jù) 數(shù)據(jù)招商加盟 天下數(shù)據(jù)合作伙伴 天下數(shù)據(jù)團(tuán)隊(duì)建設(shè) 加入天下數(shù)據(jù) 媒體報(bào)道 榮譽(yù)資質(zhì) 付款方式關(guān)注我們
微信公眾賬號(hào)
新浪微博
天下數(shù)據(jù)手機(jī)站 關(guān)于天下數(shù)據(jù) 聯(lián)系我們 誠(chéng)聘英才 付款方式 幫助中心 網(wǎng)站備案 解決方案 域名注冊(cè) 網(wǎng)站地圖
天下數(shù)據(jù)18年專注海外香港服務(wù)器、美國(guó)服務(wù)器、海外云主機(jī)、海外vps主機(jī)租用托管以及服務(wù)器解決方案-做天下最好的IDC服務(wù)商
《中華人民共和國(guó)增值電信業(yè)務(wù)經(jīng)營(yíng)許可證》 ISP證:粵ICP備07026347號(hào)
朗信天下發(fā)展有限公司(控股)深圳市朗玥科技有限公司(運(yùn)營(yíng))聯(lián)合版權(quán)
深圳總部:中國(guó).深圳市南山區(qū)深圳國(guó)際創(chuàng)新谷6棟B座10層 香港總部:香港上環(huán)蘇杭街49-51號(hào)建安商業(yè)大廈7樓
7×24小時(shí)服務(wù)熱線:4006388808香港服務(wù)電話:+852 67031102
本網(wǎng)站的域名注冊(cè)業(yè)務(wù)代理北京新網(wǎng)數(shù)碼信息技術(shù)有限公司的產(chǎn)品