CNET科技行者 8月24日 北京消息(文/周雅):繼6月20日奧斯汀發(fā)布會之后,AMD昨天正式將全套EPYC 7000系列數(shù)據(jù)中心處理器家族帶到中國。
整場發(fā)布會的重頭戲,是包括騰訊、京東、百度、聯(lián)想、曙光等十余家產(chǎn)業(yè)鏈合作伙伴帶著產(chǎn)品和合作成果為AMD站臺點(diǎn)贊,仿佛臺上的AMD重返巔峰,可見中國市場將是AMD復(fù)興之路的一個重要陣地,當(dāng)然更是一個考驗(yàn)——曾在巔峰時刻,AMD服務(wù)器最高市場占有率達(dá)到27%。
可見,圍繞EPYC(霄龍)處理器進(jìn)一步擴(kuò)大產(chǎn)業(yè)鏈合作,是AMD打開中國市場的一個策略。
比如,騰訊、百度、京東的站臺就能代表互聯(lián)網(wǎng)市場和云計(jì)算市場對EPYC的認(rèn)可,當(dāng)然同樣能代表這兩個市場的阿里巴巴也是AMD的合作伙伴。
實(shí)際上,騰訊此前已經(jīng)在自身的數(shù)據(jù)中心小規(guī)模部署一批采用EPYC(霄龍)CPU的服務(wù)器,而京東和百度也直接表態(tài),下半年開始陸續(xù)部署EPYC服務(wù)器產(chǎn)品。
當(dāng)然,EPYC也覆蓋了OEM市場:與AMD合作逾15年的曙光這次帶來9款服務(wù)器新品,全部基于EPYC平臺,涵蓋工作站、機(jī)架、刀片、整機(jī)柜服務(wù)器,面向高性能計(jì)算、云計(jì)算、大數(shù)據(jù)分析和深度學(xué)習(xí)等應(yīng)用;聯(lián)想、惠普、戴爾、宏碁、華碩五大PC廠商也在跟進(jìn)EPYC的產(chǎn)品規(guī)劃,聯(lián)想將與AMD、Hyperscale共同開發(fā)與部署單插槽和雙插槽的EPYC。
發(fā)布會一大亮點(diǎn),是多次被提及的人工智能應(yīng)用,EPYC一大性能,是機(jī)器學(xué)習(xí)。一個重磅消息隨之公布,AMD與百度將成立GPU技術(shù)聯(lián)合實(shí)驗(yàn)室,推進(jìn)GPU在人工智能技術(shù)的演進(jìn)。
雙方將共同測試、評估和優(yōu)化AMD的Radeon Instinct加速器,在需求分析、性能優(yōu)化、定制化開發(fā)等多方面密切合作,探索將AMD GPU技術(shù)應(yīng)用于百度數(shù)據(jù)中心,助力百度人工智能戰(zhàn)略的落地。
顯而易見的是,在人工智能領(lǐng)域的落地層面,少不了中美大量的企業(yè)、機(jī)構(gòu)、研究者積極投身于人工智能技術(shù)的研究和商業(yè)化。但鮮為人知的是,據(jù)公開資料顯示,近幾年人工智能開始大爆發(fā),很大一部分是由于GPU的廣泛應(yīng)用,使得并行計(jì)算變得更快、更便宜、更有效,再加上無限拓展的存儲能力和驟然爆發(fā)的大數(shù)據(jù)這兩個組合拳,也使得圖像數(shù)據(jù)、文本數(shù)據(jù)、交易數(shù)據(jù)、映射數(shù)據(jù)全面爆發(fā)。
資料還顯示,傳統(tǒng)的通用CPU之所以不適合人工智能算法的執(zhí)行,主要原因在于其計(jì)算指令遵循串行執(zhí)行的方式,沒能發(fā)揮出芯片的全部潛力,相較而言,GPU具有高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比CPU更高的效率。對比GPU和CPU在結(jié)構(gòu)上的差異,CPU大部分面積為控制器和寄存器,而GPU擁有更多的ALU(ARITHMETIC LOGIC UNIT,邏輯運(yùn)算單元)用于數(shù)據(jù)處理,這樣的結(jié)構(gòu)適合對密集型數(shù)據(jù)進(jìn)行并行處理。CPU執(zhí)行計(jì)算任務(wù)時,一個時刻只處理一個數(shù)據(jù),不存在真正意義上的并行,而GPU具有多個處理器核,在一個時刻可以并行處理多個數(shù)據(jù)。程序在GPU系統(tǒng)上的運(yùn)行速度相較于單核CPU往往提升幾十倍乃至上千倍。 因此,面向通用計(jì)算的GPU已成為加速可并行人工智能應(yīng)用程序的重要手段。
而AMD Radeon Instinct正在推動真正的新一代異構(gòu)計(jì)算。AMD近日推出的Radeon Instinct MI25、MI8和MI6加速器,結(jié)合AMDROCm 1.6軟件平臺(包括優(yōu)化的MIOpen框架庫),提高了性能、效率和易實(shí)施性,加速深度學(xué)習(xí)推理和工作負(fù)載培訓(xùn)等。這些加速器能夠滿足范圍廣泛的機(jī)器智能應(yīng)用,包括在學(xué)術(shù)、政府實(shí)驗(yàn)室、能源、生命科學(xué)、金融、汽車和其他行業(yè)的以數(shù)據(jù)為中心的HPC級系統(tǒng)。
從這兩個角度看,AMD與百度的GPU技術(shù)聯(lián)合實(shí)驗(yàn)室,顯得既恰逢其實(shí)又有的放矢。
彩蛋,附全套EPYC 7000系列數(shù)據(jù)中心處理器家族性能一覽:
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊(duì)提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。