久久久久久综合网天天,男女久久久国产一区二区三区,综合图区亚洲欧美另类图片,亚洲国产精品SSS在线观看AV,人妻少妇精品久久久久久

 
高性能之GPU領(lǐng)域解決方案
來(lái)源: | 作者:tardetech | 發(fā)布時(shí)間: 2017-04-26 | 3832 次瀏覽 | 分享到:
幾十年來(lái),計算機CPU芯片一直按照摩爾定律飛速發(fā)展,每隔十八個(gè)月,單位芯片面積上的晶體管數量就增加一倍,性能提高一倍。由于物理極限的限制,單純依靠制造工藝的提升已經(jīng)無(wú)法滿(mǎn)足計算需求,X86傳統計算平臺陷入了技術(shù)發(fā)展的瓶頸。

幾十年來(lái),計算機CPU芯片一直按照摩爾定律飛速發(fā)展,每隔十八個(gè)月,單位芯片面積上的晶體管數量就增加一倍,性能提高一倍。由于物理極限的限制,單純依靠制造工藝的提升已經(jīng)無(wú)法滿(mǎn)足計算需求,X86傳統計算平臺陷入了技術(shù)發(fā)展的瓶頸。內存延時(shí)長(cháng)、頻率低導致緩存面積越來(lái)越大,邏輯控制越來(lái)越復雜。緩存消耗了70%以上的芯片面積,同時(shí)也消耗了70%以上的電能,真正有效的運算部件面積比重很小。芯片上的晶體管密度越來(lái)越大,使得單位面積上功耗持續增加,散熱問(wèn)題日益嚴重。

由于CPU的性能提升并不是無(wú)止境的,這也就催生出計算技術(shù)向多樣化發(fā)展,而不僅僅依賴(lài)于傳統的計算平臺。當計算技術(shù)進(jìn)一步細化,GPU作為一種獨立的計算單元,以其優(yōu)異的運算性能脫穎而出,為計算技術(shù)的革新帶來(lái)了一種新的思路。

GPU計算是指利用圖形卡來(lái)進(jìn)行一般意義上的計算,而不是傳統意義上的圖形繪制。時(shí)至今日,GPU已發(fā)展成為一種高度并行化、多線(xiàn)程、多核的處理器,具有杰出的計算功率和極高的存儲器帶寬,如圖所示。




  圖:CPU和GPU的每秒浮點(diǎn)運算次數和存儲器帶寬



這種新技術(shù)并非突破了馮?諾依曼,而是參考CPU中傳統的ALU單元,將眾多的ACL單元集成到一顆芯片內部,形成ALU運算單元陣列,簡(jiǎn)化邏輯控制結構,從而滿(mǎn)足計算密集型程序的運行,成為一個(gè)獨立的計算加速單元。

CPU和GPU之間浮點(diǎn)功能之所以存在這樣的差異,原因就在于GPU專(zhuān)為計算密集型、高度并行化的計算而設計,上圖顯示的正是這種情況,因而,GPU的設計能使更多晶體管用于數據處理,而非數據緩存和流控制,如圖所示。


圖:GPU中的更多晶體管用于數據處理



GPU計算得到了業(yè)界的廣泛支持,NVIDIA、AMD、INTEL等都對芯片市場(chǎng)的微妙變化和GPU計算的技術(shù)發(fā)展前景都極為關(guān)注,并展開(kāi)了激烈的技術(shù)競賽。

作為異構計算領(lǐng)域堅定的支持者和踐行者,曙光公司從國內第一套異構集群開(kāi)始到HC2000異構計算方案的推出,一直在積極推進(jìn)國內HPC領(lǐng)域的異構計算加速技術(shù)。

GPU計算方案配置選擇,主要考慮以下因素:

1. 計算比例,通常應用程序的執行需要GPU與CPU協(xié)同完成,可根據GPU計算部分所占比重,配置節點(diǎn)GPU卡密度;

2. 計算規模,根據不同應用數據規模及計算類(lèi)型,可以選擇單機單GPU卡、單機多GPU卡和GPU集群應用模式;

3. 數據通信,在GPU集群模式下,可根據應用程序對集群通信帶寬及延遲的需求,選擇高速I(mǎi)nfiniband網(wǎng)絡(luò )或萬(wàn)兆網(wǎng)絡(luò );

4. 存儲系統:?jiǎn)喂濣c(diǎn)應用模式下一般數據量比較小,對存儲系統性能要求不高,一般采用本地存儲;集群環(huán)境下,應用數據量比較大,一般配置大容量、統一、高速的并行文件系統,另外對一些特殊應用,如石油、天然氣應用,可以在每個(gè)GPU計算節點(diǎn)內部配置SSD硬盤(pán),作為分級存儲使用,加速節點(diǎn)內部數據交換;

5. 管理調度,合理選擇GPU集群的作業(yè)調度和監控系統,可以提升集群的使用效率,降低維護成本。