在2025云棲大會(huì)上,與大模型同樣火熱的關(guān)鍵詞,是AI云。
阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長(zhǎng)兼CEO吳泳銘在大會(huì)上指出,大模型是下一代操作系統(tǒng),超級(jí)AI云是下一代超級(jí)計(jì)算機(jī)。
人工智能變革一切的趨勢(shì)也對(duì)算力提出了更高的需求,全球算力提供商紛紛面向AI轉(zhuǎn)型,為人工智能產(chǎn)業(yè)創(chuàng)新提供AI算力。
現(xiàn)場(chǎng),在英特爾專場(chǎng)論壇上,我們也看到了英特爾的AI戰(zhàn)略,以及他們提供的AI平臺(tái)“全家福”產(chǎn)品。
與此同時(shí),我們?cè)诮衲甑脑茥髸?huì)上,看到了基于英特爾至強(qiáng)6處理器的阿里云第九代企業(yè)級(jí)ECS實(shí)例g9i的最新進(jìn)展——不到150天服務(wù)超2萬(wàn)家客戶,現(xiàn)在已有接近3萬(wàn)用戶,也聽(tīng)到了關(guān)于英特爾下一代至強(qiáng)處理器的最新消息。
01 云上基礎(chǔ)設(shè)施,支撐ASI路線
2025年的云棲大會(huì)一定會(huì)成為銘刻在阿里云歷史上的一屆大會(huì),在這屆大會(huì)上,吳泳銘提出了阿里云看到的超級(jí)人工智能ASI路徑,并將通往ASI這條路劃分為三個(gè)階段:
第一階段,智能涌現(xiàn),特征是“學(xué)習(xí)人”;
第二階段,自主行動(dòng),特征是“輔助人”;
第三階段,自我迭代,特征是“超越人”。
經(jīng)過(guò)大模型的爆發(fā),人工智能技術(shù)擁有了長(zhǎng)足的進(jìn)步,我們邁入了通往ASI的第二階段。
也是在這時(shí),人工智能不再局限于語(yǔ)言交流,而是具備了在真實(shí)世界中“行動(dòng)”的能力,人工智能可以在人類制定的目標(biāo)下,拆解復(fù)雜任務(wù)、使用和制作工具,自主完成與數(shù)字世界與物理世界的交互,而AI智能體正是承載這些能力的具象載體。
我們?cè)谠茥髸?huì)上看到了各種AI智能體展示,也看到了阿里云智能集團(tuán)瓴羊CEO朋新宇在大會(huì)上發(fā)布的客服、營(yíng)銷、分析等三批企業(yè)Agent應(yīng)用。
然而,這些AI智能體的涌現(xiàn),都離不開(kāi)底層云基礎(chǔ)設(shè)施的支撐。
阿里云彈性計(jì)算產(chǎn)品負(fù)責(zé)人、存儲(chǔ)產(chǎn)品負(fù)責(zé)人陳起鯤在接受媒體采訪時(shí)指出:
“所有AI創(chuàng)新都依賴于背后算力、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施,離不開(kāi)大數(shù)據(jù)的支撐,通往ASI,需要更強(qiáng)大的AI基礎(chǔ)設(shè)施。我們的靈駿集群,可支持十萬(wàn)卡GPU高效互聯(lián),它讓模型迭代速度加快,讓底層基礎(chǔ)設(shè)施發(fā)揮作用,加速模型的訓(xùn)練和迭代。”
陳起鯤也特別指出:“正因?yàn)槲覀冇腥绱藦?qiáng)勁的基礎(chǔ)設(shè)施,我們的大模型迭代速度才能如此之快。”
只有在存儲(chǔ)、計(jì)算、網(wǎng)絡(luò)基礎(chǔ)設(shè)施上技術(shù)領(lǐng)先,才能在人工智能時(shí)代,大模型的研發(fā)先人一步,這是阿里云總結(jié)出來(lái)的經(jīng)驗(yàn)之談。
而這樣的基礎(chǔ)設(shè)施,自然也離不開(kāi)與算力供應(yīng)商的合作。
在今年的云棲大會(huì)的英特爾專場(chǎng),阿里云與英特爾聯(lián)合發(fā)布了包括兼容多代際服務(wù)器的阿里云通用算力型實(shí)例u2i、內(nèi)存增強(qiáng)型實(shí)例re8、第九代企業(yè)級(jí)ECS實(shí)例g9i,以及磐久AI高性能存儲(chǔ)服務(wù)器和磐久高密存儲(chǔ)服務(wù)器。
通過(guò)軟硬件協(xié)同優(yōu)化與底層架構(gòu)創(chuàng)新,這一系列產(chǎn)品也成了面向當(dāng)下人工智能時(shí)代的算力基礎(chǔ)設(shè)施,這其中,阿里云第九代企業(yè)級(jí)ECS實(shí)例g9i就在成了企業(yè)智能化轉(zhuǎn)型的云上基礎(chǔ)設(shè)施。
02 阿里九代ECS,百天進(jìn)萬(wàn)家
2025年4月9日,在阿里云AI勢(shì)能大會(huì)上,阿里云官宣,采用英特爾至強(qiáng)6性能核處理器的阿里云ECS g9i實(shí)例正式開(kāi)啟商業(yè)化售賣。
這也成了阿里云面向AI時(shí)代的云計(jì)算需求,進(jìn)行基礎(chǔ)設(shè)施全面升級(jí)的一項(xiàng)舉措。
這其中,英特爾至強(qiáng)6性能核處理器是英特爾于2024年9月26日正式發(fā)布的,面向服務(wù)器市場(chǎng)的最新款產(chǎn)品。
相較于上一代產(chǎn)品,英特爾至強(qiáng)6性能核處理器至多配備128核心256線程,支持高達(dá)3TB容量、8800MHz內(nèi)存,支持96條PCIe 5.0通道或64條CXL 2.0通道。
英特爾數(shù)據(jù)中心與人工智能集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立在發(fā)布會(huì)上就曾指出,“這款處理器單核性能得到了進(jìn)一步提升,對(duì)于通用計(jì)算、數(shù)據(jù)和Web服務(wù)、科學(xué)計(jì)算、AI等,英特爾至強(qiáng)6性能核處理器將是絕佳的產(chǎn)品。”
據(jù)官方公布的數(shù)據(jù)來(lái)看,具體到采用阿里云自研的CIPU+飛天技術(shù)架構(gòu)的阿里云ECS g9i實(shí)例,算力較上代提升最高達(dá)20%,L3緩存提升達(dá)50%,全核睿頻提高到3.6GHz,單盤吞吐最高達(dá)4GB/s。
針對(duì)在線游戲、數(shù)據(jù)庫(kù)、web應(yīng)用三大核心應(yīng)用場(chǎng)景,性能分別提升了15%、17%、20%。
正是由于有這樣的性能優(yōu)勢(shì),據(jù)陳起鯤透露,阿里云ECS g9i實(shí)例在發(fā)售不到100天就擁有了超過(guò)1萬(wàn)個(gè)客戶,不到150天就擁有了超過(guò)2萬(wàn)個(gè)客戶,時(shí)至今日,已經(jīng)擁有接近3萬(wàn)個(gè)客戶。
這也讓阿里云成為全球大規(guī)模云服務(wù)商中,首家大規(guī)模商業(yè)化部署英特爾g9i這一代系CPU的云廠商。
同時(shí),我們也注意到,阿里云也商業(yè)化了兼容多代際服務(wù)器(支持第五代英特爾至強(qiáng)可擴(kuò)展處理器和最新至強(qiáng)6處理器)的u2i實(shí)例,相比u1實(shí)例,性能最大提升了40%,非常適合那些算力要求不是那么強(qiáng)勁,且要求性價(jià)比的客戶。
陳起鯤也特別提到,“這樣用戶規(guī)模快速增長(zhǎng),得益于英特爾本身健康的生態(tài),從上一代英特爾或前幾代英特爾產(chǎn)品能夠平滑地切到這一代產(chǎn)品上,與此同時(shí),我們不僅在代系上提升了產(chǎn)品性能,也進(jìn)一步降低了g9i產(chǎn)品價(jià)格。”
至于算力性能大幅提升同時(shí),成本卻可以下降背后的原因,陳起鯤向我們透露了其中的原因,“通過(guò)英特爾BIOS Setting實(shí)現(xiàn)關(guān)核,能夠讓我們用同樣的一個(gè)物理服務(wù)器產(chǎn)生不一樣的實(shí)例,從而服務(wù)不一樣客戶負(fù)載的需求。”
硬件統(tǒng)一化有利于云計(jì)算服務(wù)產(chǎn)品的彈性屬性,藉由此可以實(shí)現(xiàn)同樣的硬件部署在各個(gè)可用區(qū),通過(guò)客戶不同的需求動(dòng)態(tài)調(diào)配產(chǎn)生的庫(kù)存,并將其變成相對(duì)實(shí)例所需要的云產(chǎn)品,這也正是英特爾的優(yōu)勢(shì)所在。
03 數(shù)據(jù)中心的六大挑戰(zhàn),英特爾如何應(yīng)對(duì)?
2025年,人工智能已經(jīng)成為一個(gè)確定性趨勢(shì),在這個(gè)確定性趨勢(shì)背后,是大量數(shù)據(jù)的涌現(xiàn)。
據(jù)IDC預(yù)測(cè)數(shù)據(jù)顯示,云數(shù)據(jù)中心數(shù)據(jù)增長(zhǎng)在2025年為58.1ZB,2029年將翻4倍,達(dá)到228.9ZB,2025-2029年復(fù)合年增長(zhǎng)率為40.9%。
228.9ZB意味著什么?
意味著屆時(shí)每一秒產(chǎn)生的數(shù)據(jù)量,將會(huì)是20年前一年產(chǎn)生的數(shù)據(jù)量。
陳葆立也指出,“訓(xùn)練大模型已經(jīng)將人類數(shù)據(jù)用完了,現(xiàn)在智能體會(huì)制造出來(lái)更多新數(shù)據(jù),以后智能體與智能體在互相交流過(guò)程中,還會(huì)產(chǎn)生更多數(shù)據(jù),這就需要更多算力。”
如此龐大的數(shù)據(jù)量,也對(duì)數(shù)據(jù)中心提出了更高的要求,從過(guò)往的云計(jì)算數(shù)據(jù)中心到后來(lái)的超算中心,再到現(xiàn)在的智算中心,數(shù)據(jù)中心需要面臨六個(gè)方面的挑戰(zhàn):
第一,AI無(wú)處不在,AI大規(guī)模應(yīng)用,需要數(shù)據(jù)中心能夠利用硬件加速和基于開(kāi)放標(biāo)準(zhǔn)軟件,實(shí)現(xiàn)大規(guī)模AI應(yīng)用部署,并能提供出色的性能;
第二,吞吐量和時(shí)延,AI應(yīng)用會(huì)產(chǎn)生大量數(shù)據(jù),數(shù)據(jù)中心需要提供更高的吞吐量和更低的時(shí)延來(lái)滿足性能要求;
第三,安全、質(zhì)量和可靠性,數(shù)據(jù)中心需要為AI應(yīng)用大規(guī)模部署提供安全、質(zhì)量和高可靠保障;
第四,能效和TCO,在滿足電力能效要求的同時(shí)提高機(jī)架密度,以降低總體擁有成本;
第五,可持續(xù)性,通過(guò)優(yōu)化能源效率和循環(huán)產(chǎn)品設(shè)計(jì)來(lái)減少碳排放;
第六,軟件兼容性,通過(guò)指令集架構(gòu)一致性,實(shí)現(xiàn)軟件生態(tài)系統(tǒng)的兼容。
英特爾至強(qiáng)處理器正是基于數(shù)據(jù)中心這六大關(guān)鍵訴求在不斷演進(jìn),而在云棲大會(huì)英特爾專場(chǎng),我們看到了英特爾AI戰(zhàn)略。
英特爾市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)總經(jīng)理郭威在會(huì)上指出,“英特爾AI戰(zhàn)略是為企業(yè)提供價(jià)值——利用英特爾的通算支持好AI的機(jī)頭,利用英特爾的GPU支持好智算的工作負(fù)載,利用英特爾網(wǎng)絡(luò)產(chǎn)品支持好AI負(fù)載的搬移、傳輸……”
要支持好企業(yè)AI,就需要英特爾打造AI產(chǎn)品矩陣,我們?cè)诂F(xiàn)場(chǎng)也看到了當(dāng)下英特爾面向人工智能的算力布局,這其中有:
面向小參數(shù)的英特爾酷睿Ultra處理器,有面向通用服務(wù)器運(yùn)行各種參數(shù)模型的英特爾至強(qiáng)處理器,有面向中參數(shù)、中并發(fā)、更低廉TCO企業(yè)部署的英特爾銳炫專業(yè)版B60顯卡,有面向大參數(shù)、高并發(fā)、無(wú)損精度的Gaudi 2E AI加速卡,也有通過(guò)異構(gòu)計(jì)算方式實(shí)現(xiàn)大參數(shù)、低成本MoE的至強(qiáng)處理器+銳炫顯卡組合。
就面向數(shù)據(jù)中心的算力而言,在云棲大會(huì)上,英特爾也展示出了下一代至強(qiáng)處理器——基于英特爾18A工藝制程,擁有288個(gè)核。
關(guān)于這款處理器的更新細(xì)節(jié),會(huì)上并未公布,不過(guò),談到下一代數(shù)據(jù)中心架構(gòu)迎來(lái)的變化,陳起鯤特別強(qiáng)調(diào)了“功耗需求大幅增加對(duì)更多液冷技術(shù)的需求”和“數(shù)據(jù)流動(dòng)性對(duì)高速網(wǎng)絡(luò)的需求”。
陳葆立則指出,“不管是從未來(lái)的至強(qiáng)路線圖來(lái)看,還是從我們跟一些伙伴的討論當(dāng)中來(lái)看,更快的網(wǎng)絡(luò),更高速的內(nèi)存帶寬,這都是我們已經(jīng)在規(guī)劃支持的特性。”
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注智造、硬件、機(jī)器人。