上篇的《大話“東數(shù)西算”》里,說到了東數(shù)西算是一種數(shù)據(jù)和計算的資源調(diào)配,但這種資源調(diào)配,和“南水北調(diào)”、“西氣東輸”又是大不同的。
小美:資源平衡可以理解,但數(shù)據(jù)的動態(tài)平衡,是啥意思來?
悟空博士:大家不能簡單的理解為東部的數(shù)據(jù)都要拿到西部去計算。如果這樣簡單看,沒毛病,但并沒用厘清“東數(shù)西算”的大規(guī)劃。數(shù)據(jù)的動態(tài)平衡是要先分清楚數(shù)據(jù)的分類,以此為基礎(chǔ),來理解東數(shù)西算了。
小美:悟空博士,那你快來說一說,數(shù)據(jù)怎么分類?
悟空博士:數(shù)據(jù)也有很多分類,從應(yīng)用角度來看,數(shù)據(jù)可分為熱數(shù)據(jù)和冷數(shù)據(jù)。熱數(shù)據(jù)就是需要頻繁訪問,對計算實效有較高要求的數(shù)據(jù),比如我們點外賣,當(dāng)然需要系統(tǒng)及時的響應(yīng),那么這個數(shù)據(jù)就是熱數(shù)據(jù)。簡單理解,就是我們經(jīng)常用到的數(shù)據(jù)。
小美:有熱,就有冷吧?
悟空博士:對,還有一部分就是冷數(shù)據(jù),我們偶爾訪問一下,對計算的時效性要求并不高,比如我們歸檔的電子郵件,偶爾想起來時候才會去看一眼。
小美:我知道了,冷數(shù)據(jù)和熱數(shù)據(jù)既然是按照平常用的應(yīng)用頻率來區(qū)分的,那么,這樣的區(qū)別,具體在“東數(shù)西算”中如何體現(xiàn)?
悟空博士:東數(shù)西算中的“數(shù)”,要看的是冷數(shù)據(jù)和熱數(shù)據(jù)之間的平衡,熱數(shù)據(jù)盡量留在距離用戶近的東部,而冷數(shù)據(jù)則運到距離用戶較遠(yuǎn)的西部,數(shù)據(jù)的動態(tài)平衡,放在這里,就是要隨著數(shù)據(jù)的冷熱進(jìn)行動態(tài)的平衡。
小美:這種動態(tài)平衡延伸開來,也會引發(fā)一系列效應(yīng)吧?
悟空博士: 是的,算力在寸土寸金的東部自然要更貴一些,而在自然資源豐富的西部則更具價格優(yōu)勢。但成本同樣需要考慮到,數(shù)據(jù)往返運送所涉及到的網(wǎng)絡(luò)成本,以及往返的時間成本等。
小美:東數(shù)西算是全國一盤大棋,考量的會更多吧?
悟空博士:對頭,東數(shù)西算既要考慮算力成本,也要考慮往返的網(wǎng)絡(luò)成本以及時間成本,是結(jié)合成本考量后的平衡布局,確保相關(guān)數(shù)據(jù)的計算能保持一個成本最優(yōu)解。
當(dāng)然,“東數(shù)西算”實現(xiàn)的是更大意義上的平衡。西部的數(shù)字經(jīng)濟(jì)也會隨著算力中心的潛移,而最終受益。
小美:西部能夠接收東部的數(shù)據(jù),說明西部也有一些條件是適合來接收的,這其中有哪些契機。
悟空博士:電力成本、土地成本、人才成本放在西部,就降低了許多,因此,西部的算力就比東部的整體算力成本低,是彌補東部算力不足的劃算選擇。這些都是大家很容易想到的理由。
小美:那肯定還有很多大家不容易想到的理由了。
悟空博士:首先,技術(shù)是最不容忽視的,跟以往的資源調(diào)度所不同,“東數(shù)西算”之所以能提出,因為有了新的契機:網(wǎng)絡(luò)能力逐步提升,互聯(lián)網(wǎng)架構(gòu)也在調(diào)整,這些讓“東數(shù)西算”成為可能。
小美:過去的網(wǎng)絡(luò)不能實現(xiàn)這樣的傳輸嗎?
悟空博士:過去的網(wǎng)絡(luò)傳輸能力還是有點“心有余,力不足”。傳輸海量的數(shù)據(jù),需要有強大的網(wǎng)絡(luò)。
曾經(jīng)有一個段子,亞馬遜為了計算處理數(shù)據(jù),公司用貨車?yán)脖P到數(shù)據(jù)中心來處理,而不是像想象中的那樣用“云”。
小美:原來還有這么一回事啊,下次咱們繼續(xù)說。
作者:
中國信通院云大所副總工程師 王蘊韜
科技行者執(zhí)行總編輯 孫封蕾
大話“東數(shù)西算”
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟(jì)。
參與編寫了《開源法則》(人民郵電出版社),《人類計算簡史:從中國算盤到數(shù)字經(jīng)濟(jì)》(中共中央黨校出版社)。