亞馬遜云科技在2023 re:Invent全球大會(huì)上宣布,亞馬遜云科技與英偉達(dá)宣布擴(kuò)大戰(zhàn)略合作,將聯(lián)合推出先進(jìn)的基礎(chǔ)設(shè)施、軟件及服務(wù),推動(dòng)客戶在生成式AI(Generative AI)的創(chuàng)新。
雙方將英偉達(dá)與亞馬遜云科技技術(shù)優(yōu)勢(shì)相結(jié)合,為訓(xùn)練基礎(chǔ)模型和構(gòu)建生成式AI應(yīng)用提供理想環(huán)境,具體包含英偉達(dá)新一代GPU、CPU與AI軟件的最新多節(jié)點(diǎn)系統(tǒng),以及亞馬遜云科技的Nitro System先進(jìn)虛擬化與安全平臺(tái)、Elastic Fabric Adapter(EFA)互連技術(shù)和UltraCluster擴(kuò)展能力。
亞馬遜云科技與英偉達(dá)一直保持長(zhǎng)期合作關(guān)系,攜手為生成式AI賦能。此次擴(kuò)大合作將為機(jī)器學(xué)習(xí)(ML)開(kāi)拓者提供推動(dòng)這些技術(shù)進(jìn)一步發(fā)展所需的計(jì)算性能。雙方合作的內(nèi)容包括:
1、亞馬遜云科技推出首款結(jié)合NVIDIA Grace Hopper Superchip與Amazon UltraCluster擴(kuò)展功能的云AI超級(jí)計(jì)算機(jī)。
2、NVIDIA DGX Cloud率先配備NVIDIA GH200 NVL32,并首次在亞馬遜云科技上提供此AI訓(xùn)練即服務(wù)。
3、英偉達(dá)和亞馬遜云科技在Project Ceiba上合作,打造全球最快的GPU驅(qū)動(dòng)AI超級(jí)計(jì)算機(jī)以及最新的NVIDIA DGX Cloud超級(jí)計(jì)算機(jī),用于英偉達(dá)的AI研發(fā)以及自研模型開(kāi)發(fā)服務(wù)。
4、配置NVIDIA GH200、H200、L40S以及L4 GPU等芯片的全新Amazon EC2實(shí)例,大幅提升生成式AI、HPC高性能計(jì)算、設(shè)計(jì)以及模擬類工作負(fù)載的性能。
5、在亞馬遜科技上運(yùn)行的英偉達(dá)軟件,包括NeMo LLM框架、NeMo Retriever以及BioNeMo,加速自研模型、語(yǔ)義檢索、新藥研發(fā)等應(yīng)用的生成式AI發(fā)展。
此次雙方合作將大幅加速所有產(chǎn)業(yè)應(yīng)用生成式AI的發(fā)展,具體內(nèi)容包括:
1、亞馬遜云科技是第一家在云端配備具有多節(jié)點(diǎn)NVLink技術(shù)的NVIDIA GH200 Grace Hopper Superchips的云廠商。NVIDIA GH200 NVL32多節(jié)點(diǎn)平臺(tái)運(yùn)用NVIDIA NVLink與NVSwitch技術(shù)連接32個(gè)Grace Hopper Superchips,組成一個(gè)實(shí)例。此平臺(tái)將在Amazon Elastic Compute Cloud(Amazon EC2)實(shí)例上可用,與亞馬遜強(qiáng)大的網(wǎng)絡(luò)(EFA)相連,由先進(jìn)的虛擬化(Amazon Nitro System)及超大規(guī)模集群(Amazon EC2 UltraClusters)提供支持,讓共同客戶能擴(kuò)展至數(shù)千個(gè)GH200 Superchips。
2、英偉達(dá)與亞馬遜云科技將連手在亞馬遜云科技上推出NVIDIA DGX Cloud NVIDIA AI訓(xùn)練即服務(wù)(AI-training-as-a-service)。此服務(wù)將是首個(gè)配置GH200 NVL32的DGX Cloud,為開(kāi)發(fā)者提供單一實(shí)例中最多的共享內(nèi)存。在亞馬遜云科技上運(yùn)行的DGX Cloud將加速訓(xùn)練含有超過(guò)1兆參數(shù)的尖端生成式AI與大型語(yǔ)言模型。
3、英偉達(dá)與亞馬遜云科技合作推動(dòng)Project Ceiba,構(gòu)建全球最快的GPU驅(qū)動(dòng)的AI超級(jí)計(jì)算機(jī),這是一個(gè)配備GH200 NVL32與Amazon EFA互連技術(shù)的大規(guī)模系統(tǒng),該系統(tǒng)部署在亞馬遜云科技上,為英偉達(dá)研發(fā)團(tuán)隊(duì)提供服務(wù)。該開(kāi)創(chuàng)先河的超級(jí)計(jì)算機(jī)配置16,384顆NVIDIA GH200 Superchips,能處理65 exaflops速度等級(jí)的AI運(yùn)算,英偉達(dá)使用該超級(jí)計(jì)算機(jī)推動(dòng)其全新生成式AI的創(chuàng)新。
4、亞馬遜云科技將推出三款A(yù)mazon EC2實(shí)例:P5e實(shí)例配置NVIDIA H200 Tensor Core GPUs,針對(duì)大規(guī)模與尖端生成式AI及HPC高性能運(yùn)算工作負(fù)載;分別配置NVIDIA L4 GPUs與NVIDIA L40S GPUs的G6 與G6e實(shí)例,可運(yùn)行包括AI微調(diào)、推理、繪圖以及影片工作負(fù)載等廣泛應(yīng)用。G6e實(shí)例特別適用于開(kāi)發(fā)3D工作流程、數(shù)字孿生、以及其他使用NVIDIA Omniverse的應(yīng)用,用來(lái)連結(jié)與構(gòu)建各種生成式AI的3D應(yīng)用。
亞馬遜云科技首席執(zhí)行官Adam Selipsky表示:“亞馬遜云科技與英偉達(dá)合作已經(jīng)超過(guò)13年,我們的合作起源于推出全球首個(gè)配置GPU的云端實(shí)例?,F(xiàn)在我們推出最廣泛的英偉達(dá) GPU解決方案,可用于各種工作負(fù)載,包括繪圖、游戲、HPC高性能計(jì)算、機(jī)器學(xué)習(xí),直到現(xiàn)在的生成式AI。我們持續(xù)運(yùn)用英偉達(dá)技術(shù)推動(dòng)創(chuàng)新,并通過(guò)將新一代NVIDIA Grace HopperSuperchips與亞馬遜云科技強(qiáng)大看的網(wǎng)絡(luò)EFA、超大規(guī)模集群EC2 UltraClusters以及先進(jìn)虛擬化能力Nitro相結(jié)合,讓亞馬遜云科技成為運(yùn)行GPU的最佳云端環(huán)境。”
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“生成式AI正改變各種云端負(fù)載,為多元內(nèi)容創(chuàng)作在底層注入加速計(jì)算動(dòng)能。我們共同目標(biāo)是為每個(gè)客戶提供具有成本效益、先進(jìn)生成式AI,為此英偉達(dá)與亞馬遜云科技在整個(gè)計(jì)算堆棧展開(kāi)合作,橫跨AI基礎(chǔ)設(shè)施、加速庫(kù)(acceleration libraries)、基礎(chǔ)模型以及生成式AI服務(wù)。”
在亞馬遜云科技云端上運(yùn)行英偉達(dá)軟件,加速生成式AI的研發(fā)
此外,英偉達(dá)宣布推出在亞馬遜云科技上運(yùn)行的軟件,用于加速其生成式AI的研發(fā)。NVIDIA NeMo Retriever microservice微服務(wù)提供多項(xiàng)新工具,用來(lái)創(chuàng)造高精準(zhǔn)度的聊天機(jī)器人,以及運(yùn)用加速的語(yǔ)意檢索技術(shù)的歸納工具。在Amazon SageMaker上可用的NVIDIA BioNeMo,并計(jì)劃在亞馬遜云科技托管的NVIDIA DGX Cloud,讓制藥企業(yè)加快新藥開(kāi)發(fā),企業(yè)可運(yùn)用自己的數(shù)據(jù)簡(jiǎn)化與加速模型訓(xùn)練。
在亞馬遜云科技云端運(yùn)行的英偉達(dá)軟件將幫助亞馬遜為其服務(wù)與運(yùn)營(yíng)注入創(chuàng)新動(dòng)能。亞馬遜云科技正運(yùn)用NVIDIA NeMo框架訓(xùn)練新一代大語(yǔ)言模型Amazon Titan。Amazon Robotics也已開(kāi)始借助NVIDIA Omniverse Isaac打造數(shù)字孿生,在虛擬化環(huán)境中推動(dòng)自主倉(cāng)庫(kù)的自動(dòng)化、優(yōu)化以及規(guī)劃,完成之后再部署到真實(shí)環(huán)境。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。