亞馬遜云科技宣布Amazon EC2 P5實例正式可用
加速生成式AI和高性能計算應用,由英偉達H100 Tensor Core GPU提供支持
亞馬遜云科技近日在紐約峰會上宣布Amazon Elastic Compute Cloud(EC2)P5實例正式可用。這是一款下一代GPU實例,由最新的英偉達H100 Tensor Core GPU提供支持,可以滿足客戶在運行人工智能、機器學習和高性能計算工作負載時對高性能和高擴展性的需求。與上一代基于GPU的實例相比,Amazon EC2 P5實例可以將訓練時間縮減6倍(從幾天縮短到幾小時),從而幫助客戶節(jié)省高達40%的訓練成本。
Amazon EC2 P5實例提供8個英偉達H100 Tensor Core GPU,具有640 GB高帶寬GPU內(nèi)存,同時提供第三代AMD EPYC處理器、2TB系統(tǒng)內(nèi)存和30 TB本地NVMe存儲。Amazon EC2 P5實例還提供3200 Gbps的聚合網(wǎng)絡(luò)帶寬并支持GPUDirect RDMA,從而能夠繞過CPU進行節(jié)點間通信,實現(xiàn)更低的延遲和高效的橫向擴展性能。
【資料圖】
亞馬遜云科技與英偉達攜手開發(fā)下一代基礎(chǔ)設(shè)施
亞馬遜云科技和英偉達(NVIDIA)在今年3月宣布了一項多方合作,構(gòu)建全球最具可擴展性且按需付費的人工智能基礎(chǔ)設(shè)施,以便訓練日益復雜的大語言模型和開發(fā)生成式AI應用程序。
當時,亞馬遜云科技預發(fā)布了由英偉達H100 Tensor Core GPU支持的Amazon EC2 P5實例,可為構(gòu)建和訓練更大規(guī)模的機器學習模型提供高達20 exaFLOPS的算力。亞馬遜云科技和英偉達合作十多年來成果頗豐,推出了包括支持視覺計算、人工智能和高性能計算集群的各種GPU實例,如CG1實例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和P4de(2022年)實例。
現(xiàn)在,機器學習模型的規(guī)模已經(jīng)達到數(shù)萬億參數(shù),這種復雜性大大增加了客戶訓練模型所需的時間,例如,最新的大語言模型訓練時間長達數(shù)月之久。類似的趨勢也出現(xiàn)在高性能計算領(lǐng)域。隨著高性能計算客戶數(shù)據(jù)收集準確度的提高以及數(shù)據(jù)集達到EB級規(guī)模,客戶已經(jīng)在尋找解決日益復雜應用程序的更快方法。
關(guān)于Amazon EC2 P5實例
Amazon EC2 P5實例非常適合訓練和運行越來越復雜的大語言模型和計算機視覺模型,以滿足最苛刻的計算密集型生成式AI應用的需求,包括問答、代碼生成、視頻和圖像生成、語音識別等。與上一代基于GPU的實例相比,Amazon EC2 P5實例在這些應用中的訓練時間縮短了6倍。那些可以在工作負載中使用較低精度FP8數(shù)據(jù)類型的客戶,例如使用Transformer框架的語言模型,將通過英偉達Transformer Engine的支持獲得高達6倍的性能提升。
高性能計算客戶通過使用Amazon EC2 P5實例可以在藥物發(fā)現(xiàn)、地震分析、天氣預報和金融建模等領(lǐng)域更大規(guī)模地部署高要求的應用程序。此外,對于使用基于動態(tài)規(guī)劃(Dynamic Programming)算法進行基因組測序或加速數(shù)據(jù)分析等應用的客戶,Amazon EC2 P5將通過新的DPX指令集提供支持。
Amazon EC2 P5實例使客戶能夠探索以前看似無法解決的問題,更快地迭代解決方案,并加速進入市場。
第二代Amazon EC2 UltraClusters和Elastic Fabric Adapter
Amazon EC2 P5實例為多節(jié)點分布式訓練和緊密耦合的高性能計算工作負載提供先進的橫向擴展功能,其使用的第二代Elastic Fabric Adapter(EFA)網(wǎng)絡(luò)設(shè)備提供高達3200 Gbps的網(wǎng)絡(luò)速度,是Amazon EC2 P4d實例的8倍。
為了滿足客戶對大規(guī)模和低延遲的需求,Amazon EC2 P5實例部署在第二代Amazon EC2 UltraClusters中,該集群目前可在超過2萬個英偉達H100 Tensor Core GPU上為客戶提供更低的延遲。作為云中最大規(guī)模的機器學習基礎(chǔ)設(shè)施之一,Amazon EC2 UltraClusters中的Amazon EC2 P5實例可提供高達20 exaFLOPS的聚合計算能力。
Amazon EC2 UltraClusters使用了Amazon FSx for Lustre,這是一種完全托管的共享存儲,構(gòu)建在常用的高性能并行文件系統(tǒng)上??蛻敉ㄟ^Amazon FSx for Lustre,可以按需大規(guī)??焖偬幚砗A繑?shù)據(jù)集,并實現(xiàn)亞毫秒級延遲。Amazon FSx for Lustre的低延遲和高吞吐量特性經(jīng)過優(yōu)化,可在Amazon EC2 UltraCluster上為深度學習、生成式AI和高性能計算工作負載提供支持。
Amazon FSx for Lustre可以為Amazon EC2 UltraCluster中的GPU和機器學習加速器持續(xù)提供數(shù)據(jù),從而加速最苛刻的工作負載,包括大語言模型訓練、生成式AI推理,以及基因組學和金融風險建模等高性能計算負載。
Amazon EC2 P5實例現(xiàn)已正式可用
Amazon EC2 P5實例現(xiàn)已在以下區(qū)域正式可用:美國東部(北弗吉尼亞)和美國西部(俄勒岡)。更多信息可訪問:Amazon EC2定價和Amazon EC2 P5實例。
客戶也可以選擇亞馬遜云科技提供的各種內(nèi)置生成式AI的云服務,它們都運行在具有成本效益的生成式AI云基礎(chǔ)設(shè)施上,助力客戶加快創(chuàng)新和重塑應用。更多信息請訪問亞馬遜云科技生成式AI頁面。
關(guān)鍵詞:
您可能也感興趣:
為您推薦
7月7日淄博德合新戊二醇價格暫穩(wěn)
世貿(mào)組織投資便利化協(xié)定成功結(jié)束文本談判
外媒:扎波羅熱地區(qū)發(fā)生爆炸 釋放了什么信號?
排行
最近更新
- 亞馬遜云科技宣布Amazon EC2 P5實例正式可用
- ESG投資引擎推動經(jīng)濟高質(zhì)量發(fā)展,第二屆ESG發(fā)展論壇在穗舉辦
- gt610跑分只有4000分(gt610跑分多少)
- 華為與三家同舟共濟伙伴簽約,攜手深耕城市數(shù)字化
- 好萊塢名導:“美國宣傳機器歪曲普京形象”
- 海河流域發(fā)生流域性較大洪水
- 【寶匯投資】 PCE隨著CPI通脹數(shù)據(jù)完美地落地,那未來走勢呢
- 第四屆公立醫(yī)院后勤建設(shè)管理會議在武漢召開
- 肆拾玖坊泰斗酒傳承工藝,釀造經(jīng)典
- 中國企業(yè)社會責任年會正式公布2023年度責任先鋒
- 《舍陂記》亮相書博會,為時代保留一份鄉(xiāng)土記憶
- “0xC57E”錢包地址1天內(nèi)獲利442枚ETH
- 寫好高質(zhì)量發(fā)展“人才篇” 鍋圈食匯榮獲中國企業(yè)社會責任...
- “五個女博士”爭議廣告被罰近50萬
- 賽倫生物董事長因涉嫌職務犯罪被實施留置
- 高端冰淇淋越來越卷 頭部零售企業(yè)是怎么挖掘爆款的?
- 啟牛學堂助居民合理調(diào)整家庭資產(chǎn)規(guī)劃
- 宏利基金師婧:下半年印度市場相對優(yōu)勢明顯
- 國家統(tǒng)計局:7月制造業(yè)PMI49.3% 連續(xù)兩個月平穩(wěn)上升
- 深南電路董秘回復:公司現(xiàn)已具備FC-BGA封裝基板中階產(chǎn)品樣品...
- 2023年沈陽新增了哪些學校?這18所學校首次招生
- 中國IC獨角獸,沖出一片天
- 中國名歌大全100首 中國名歌大全
- 祥龍電業(yè)7月31日快速上漲
- 肉末豆腐家常做法簡單?
- 木耳功效與作用?
- 木耳的常用名字?
- 黑木耳有哪些藥用價值?
- 巖耳與木耳哪個好?
- 太藍新能源博士后科研工作站正式授牌成立