日韩av在线高清免费毛片日韩欧美一级成人|女人18以后毛片|国产18女人毛多水多毛片|乱系列人妻视频|中文字幕久久熟女人妻av|91麻豆人妻|校花被我玩弄|父女乱荡|高潮videossex潮喷另类|日本在线观看人妻,黑人侵犯日本人妻,色哟哟视频线在线播放欧美,亚洲欧美国产国产一区第二页

手機(jī)版

掃一掃,,手機(jī)訪問

關(guān)于我們 加入收藏

澳汰爾工程軟件(上海)有限公司

1 年白金會員

已認(rèn)證

撥打電話
獲取底價
提交后,商家將派代表為您專人服務(wù)
立即發(fā)送
點擊提交代表您同意 《用戶服務(wù)協(xié)議》
當(dāng)前位置:
澳汰爾 >技術(shù)文章 >

技術(shù)干貨丨如何選用顯卡 (GPU) 開展EDEM的計算,?

技術(shù)干貨丨如何選用顯卡 (GPU) 開展EDEM的計算,?
澳汰爾  2025-02-26  |  閱讀:197

由于離散單元法的特性,EDEM軟件計算量大,,對計算設(shè)備要求較高,。一個計算能力強(qiáng)的計算設(shè)備可在更短的時間完成計算任務(wù),加速業(yè)務(wù)進(jìn)程,,提高業(yè)務(wù)效率,。


過去以來,中央處理器 (CPU) 一直被用作計算設(shè)備,。然而,,隨著計算機(jī)圖形處理器 (俗稱顯示卡或者顯卡,GPU) 的技術(shù)更新,,GPU也可用于計算,,且在特定的計算場景中發(fā)揮出 (遠(yuǎn)) 優(yōu)于CPU的計算性能。這包括EDEM離散單元法計算場景,。


本文將簡單討論GPU計算在EDEM中的應(yīng)用,,以及用于EDEM計算的GPU選取。


用于EDEM計算的GPU選取


為什么要用GPU開展EDEM計算,?

GPU與CPU的顯著區(qū)別在于,,前者可同時并行計算的核心數(shù)高 (多達(dá)數(shù)千),但單個核心時鐘頻率 (與計算速度正相關(guān)) 較低,;后者核心數(shù)少 (幾十個),,但單個核心始終頻率高。一個比喻是,,GPU仿佛是一個小學(xué)數(shù)千名小學(xué)生,,而CPU是這所小學(xué)的數(shù)十名老師。對于單一流程的任務(wù)而言,,一個老師的處理速度勝過一個小學(xué)生,;但對于諸如完成1000000道口算題這類可分割的計算任務(wù)而言,數(shù)千小學(xué)生并行開動,,將勝過數(shù)十名老師,。


離散單元法就是可分割的計算任務(wù),每一時間步對1000000個顆粒單元的處理,,就好比完成1000000道口算題,。此時GPU相比CPU將具有顯著優(yōu)勢,。鑒于上述原因,自EDEM 2019開始,,支持GPU運算,。當(dāng)然,實際計算機(jī)系統(tǒng)中,,GPU由CPU統(tǒng)籌和管轄,,如同老師們需要準(zhǔn)確分配不同的口算題給具體的小學(xué)生。


EDEM GPU計算架構(gòu)

目前EDEM GPU求解器使用Nvidia CUDA實現(xiàn),,已支持多球團(tuán)簇 (multi-sphere),、膠囊體 (sphero-cylinder) 和多面體 (polyhedral) 全部三種顆粒形態(tài),并已全面支持API自定義模型,,計算效率與內(nèi)置模型無異,。Nvidia CUDA是全球主流GPU高性能計算 (HPC) 架構(gòu),歷史最為悠久,,在國際上具有廣泛的用戶基礎(chǔ),迭代更新快,。


然而,,Nvidia CUDA僅支持Nvidia品牌的顯卡,諸如AMD等品牌的顯卡無法使用Nvidia CUDA進(jìn)行計算,,也無法使用EDEM GPU計算,。(先前EDEM GPU求解器使用OpenCL架構(gòu)實現(xiàn),OpenCL支持Nvidia和AMD等全品類顯卡,。但OpenCL已停止更新,,鑒于此,EDEM最新版GPU運算已不再支持OpenCL求解器,。)


EDEM 對顯卡的最低配置要求如下:

1.支持CUDA,,且計算能力支持版本3.5以上 (詳見CUDA GPUs - Compute Capability | NVIDIA Developer)。除個別極為古老的顯卡 (如Nvidia GTX系列),,基本都滿足該條件,。

2.驅(qū)動程序中,CUDA版本11.0以上,。


對EDEM計算而言,,幾萬到十幾萬顆粒的計算規(guī)模,選擇普通家用顯卡 (如游戲顯卡) 足以,。后文會詳述顯卡的選取,。


EDEM GPU計算架構(gòu)

EDEM GPU的計算精度有三種模式:

1.雙精度 (double precision);

2.單精度 (single precision),;

3.混合精度 (hybrid precision),。


這是與GPU的精度模式相匹配的,。


在計算機(jī)中,小數(shù)多由浮點數(shù) (floating point number) 表示,。浮點數(shù)以科學(xué)計數(shù)法表示小數(shù),,包含若干位有效數(shù)字 (可正可負(fù)) 和一個整數(shù)指數(shù) (可正可負(fù)),如 -1.2E-2 表示小數(shù) -0.012,。在計算機(jī)中,,有效數(shù)字和指數(shù)整合在一起,以二進(jìn)制形式存儲,,為一個浮點數(shù),。


單精度和雙精度浮點數(shù)的區(qū)別在于有效數(shù)字位數(shù)不同。這也直接決定了二者所占存儲空間不同,。


單精度 (FP32):使用32位二進(jìn)制 (4字節(jié)) 表示,,有效數(shù)字7位,適用于大多數(shù)科學(xué)計算和通用計算任務(wù),。


雙精度 (FP64):使用64位二進(jìn)制 (8字節(jié)) 表示,,有效數(shù)字15位,適用于需要更高精度計算的科學(xué)和工程應(yīng)用,。


對于離散單元法來說,,盡可能使用雙精度FP64計算,可最大程度保證工程計算精度,。曾有文獻(xiàn)指出,,有學(xué)者使用俠盜獵車手5的三維引擎——R星 (Rockstar) 進(jìn)行離散元計算,但由于引擎只支持單精度FP32,,計算誤差發(fā)散嚴(yán)重,,計算結(jié)果失真較大。


目前計算機(jī)的CPU均支持64位雙精度計算,。但對于消費級GPU顯卡,,64位雙精度運算由于使用場景較少 (大多數(shù)為一般通用計算任務(wù)),廠商為了降低售價提高銷量,,削弱了消費級GPU的FP64能力 (但Nvidia RTX 30系以上消費級顯卡基本保留部分FP64能力),,導(dǎo)致這些顯卡雙精度計算能力受限。


對于這些顯卡,,在使用時需要考慮更換精度模式保證計算速度,。對于Nvidia頂尖顯卡,如A100 (800),、H100 (800) 等,,這些顯卡專供HPC科學(xué)計算,F(xiàn)P64能力不會削減,,因此直接采用雙精度模式計算即可,。而對于桌面級顯卡例如 Nvidia RTX 30/40 系顯卡 (如4090等),,雙精度模式受限,需適當(dāng)降低精度保證計算效率,。尤其是在試算或者粗略計算大概結(jié)果的場景,,快速計算十分必要。此時,,降低精度快速出結(jié)果,,對于業(yè)務(wù)而言至關(guān)重要。


混合精度模式 (hybrid precision) 為Nvidia特色技術(shù),,可根據(jù)GPU狀況,,智能對浮點數(shù)據(jù)指定單雙精度策略??梢栽谛屎途戎g取得最佳平衡,。


多GPU使用策略

最新的EDEM版本已支持調(diào)度多個顯卡 (GPU) 進(jìn)行并行計算。依舊以小學(xué)作比喻,,這就仿佛將一個口算任務(wù)分配給兩個小學(xué)完成,。


一般而言,多GPU僅在問題規(guī)模特別大時使用,。因為計算過程中,,GPU之間會通信,通信成本較大,。因此,盡可能使用單個GPU進(jìn)行計算,。


但是如果問題規(guī)模特別大,,例如數(shù)百萬顆粒的時候,單GPU可能面臨存儲空間不足的情況 (離散單元法不僅計算量大,,存儲空間占用也很大),。目前主流計算機(jī)內(nèi)存條 (RAM) 高達(dá)32-64GB,但是一張 30 或者 40 系的Nvidia顯卡,,其顯存 (VRAM) 只有幾個GB,。EDEM GPU計算時,顆粒和接觸信息被存入顯存進(jìn)行計算,,如果問題規(guī)模足夠大,,顯存可能會不足,從而導(dǎo)致無法計算,。此時就可以考慮多GPU并行策略,,通過多張顯卡并行,來分擔(dān)計算任務(wù),,確保每張卡顯存容量足夠完成對應(yīng)分塊的計算,。


但需要考慮多張顯卡采購的成本,,是否優(yōu)于單張高顯存容量的顯卡 (如A100,單張80GB),。還是那句話,,顯卡間通信速度有限,盡可能使用單張卡進(jìn)行計算,。


EDEM GPU計算表現(xiàn)

以下是不同工況的仿真,、分別使用12線程CPU與GPU計算時,EDEM的計算速度,。為Altair自測得到,。可以發(fā)現(xiàn),,使用CUDA GPU計算可以最大程度提升EDEM的計算效率,,相比CPU計算提速數(shù)十倍。


094030_276097_jswz.jpg

表1 計算工況


094048_779942_jswz.png

圖1 EDEM CPU與GPU計算速度對比 (CPU為12線程)


選擇GPU顯卡用于EDEM計算,,對于提升工程效率至關(guān)重要,;而我們要如何選擇GPU顯卡呢?

用于EDEM計算的GPU顯卡,,主要關(guān)注以下幾個指標(biāo):

  • 時鐘頻率 (MHz) 與內(nèi)核數(shù),,二者均與計算速度正相關(guān);

  • FP32 與 FP64 性能 (單位: TFLOPS),,直接決定顯卡計算浮點小數(shù)多快,;

  • 顯存帶寬 (GB/s),決定GPU與CPU通信速度,,通信速度太慢可能會成為瓶頸,;

  • 顯存大小 (GB),將決定單卡可承擔(dān)的最大計算規(guī)模,。


Altair 也做了一些計算測試供參考:

攪拌器模型,,生成1,000,000顆粒,生成速度100,000/s,,顆粒初始下落速度3m/s (圖2),。以12線程CPU為基準(zhǔn)計算速度,在顆粒生成計算過程中,,單卡V100和單卡RTX ada 6000的加速比分別為4.5和7.2,。而在顆粒攪拌計算過程中,使用雙卡V100和雙卡RTX ada 6000仿真,,加速比相比單卡近乎加倍,。雙卡并行計算的效率幾乎成倍增加。


微信圖片_20250226094004.png

(1) 仿真工況


094147_216953_jswz.png

(2) 顆粒生成加速比


094158_455537_jswz.png

(3) 顆粒攪拌加速比


而關(guān)于Nvidia RTX 30-40系顯卡的計算效率對比詳見圖3和表2,。圖3可用于選購顯卡時參考,。


094215_337846_jswz.jpg

表2 GPU顯卡計算用時對比


094231_000605_jswz.png

圖3 不同顯卡 (包含多卡) 加速比對比 (以WS4075為基準(zhǔn))


需要說明的是,,GPU計算受到CPU、內(nèi)存等電腦配置因素影響,,實際計算用時可能與上述結(jié)果有出入,。如對顯卡采購以及顯卡和EDEM適配有疑問,請聯(lián)系A(chǔ)ltair 技術(shù)工程師,,我們竭誠為您服務(wù),。


A

申請免費試用

如您對 Altair EDEM 感興趣

歡迎掃描二維碼申請免費試用:


094317_524018_jswz.png


相關(guān)閱讀:

1. How to select a GPU (Graphics Processing Unit) for EDEM - Altair Unlimited, EDEM - Altair Products - Altair Community

2. 10 Common Questions about EDEM GPU Answered - EDEM - Altair Products - Altair Community


關(guān)于 Altair 澳汰爾

Altair(納斯達(dá)克股票代碼:ALTR)是計算科學(xué)和智能領(lǐng)域的全球領(lǐng)導(dǎo)者之一,在仿真,、高性能計算 (HPC) 和人工智能等領(lǐng)域提供軟件和云解決方案,。Altair 能使跨越廣泛行業(yè)的企業(yè)們在連接的世界中更高效地競爭,并創(chuàng)造更可持續(xù)的未來,。


公司總部位于美國密歇根州,,服務(wù)于16000多家全球企業(yè),應(yīng)用行業(yè)包括汽車,、消費電子,、航空航天、能源,、機(jī)車車輛,、造船、國防軍工,、金融,、零售等。

相關(guān)產(chǎn)品

更多

材料數(shù)據(jù)中心

型號:Altair? Material Data Center(AMDC)材料數(shù)據(jù)中心

面議
Altair One仿真,、數(shù)據(jù)分析,、計算資源的統(tǒng)一云平臺

型號:Altair One仿真、數(shù)據(jù)分析,、計算資源的統(tǒng)一云平臺

面議
Altair Simulation Cloud Suite數(shù)字化仿真管理平臺

型號:Altair Simulation Cloud Suite數(shù)字化仿真管理平臺

面議
Altair? lOT Studio人工智能及物聯(lián)網(wǎng)智能產(chǎn)品開發(fā)

型號:Altair? lOT Studio人工智能及物聯(lián)網(wǎng)智能產(chǎn)品開發(fā)

面議
  • 推薦產(chǎn)品
  • 供應(yīng)產(chǎn)品
留言咨詢
(我們會第一時間聯(lián)系您)
關(guān)閉
留言類型:
     
*姓名:
*電話:
*單位:
Email:
*留言內(nèi)容:
(請留下您的聯(lián)系方式,以便工作人員及時與您聯(lián)系?。?/div>