作者|周雅
狂奔了將近一年后,大模型的風(fēng)終究是吹到了更實(shí)在的應(yīng)用落地,這對(duì)于幾乎所有AI創(chuàng)業(yè)者來(lái)說(shuō),是機(jī)會(huì)也是挑戰(zhàn)。
要知道,大模型不是平地起高樓的新物種,它是在過(guò)去算力不斷迭代、數(shù)據(jù)量不斷擴(kuò)充的基礎(chǔ)上,涌現(xiàn)的一種技術(shù)產(chǎn)物。所以對(duì)大部分創(chuàng)業(yè)者來(lái)說(shuō),即使自己不從頭開發(fā)基礎(chǔ)大模型,但如果為了模型微調(diào)及增加RAG知識(shí)庫(kù),為產(chǎn)品增加垂類知識(shí);優(yōu)化用戶交互體驗(yàn);提高Token輸出效率,一定的算力仍是必須。
正如近期由英特爾和至頂科技組織的 AI Summit·PEC AI新勢(shì)力專場(chǎng)活動(dòng)上,來(lái)自產(chǎn)學(xué)研的參會(huì)嘉賓所達(dá)成的一致共識(shí)是,智能場(chǎng)景無(wú)處不在,來(lái)自“端、邊、云”的智能算力也無(wú)處不在。
面向AI帶來(lái)的智算時(shí)代,多年來(lái)一直根植于算力生態(tài)的英特爾,打出了“讓AI無(wú)處不在(Bring AI Everywhere)”的口號(hào),從硬件到軟件到生態(tài),全面擁抱AI,賦能AI創(chuàng)業(yè)者。
從云原生到AI原生:先解成本難題
如果說(shuō),過(guò)去的互聯(lián)網(wǎng)或移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)企業(yè),伴隨云計(jì)算的發(fā)展,從「上云」發(fā)展到「云原生」;那么在當(dāng)下的AI時(shí)代,數(shù)智化不斷迭代升級(jí)的過(guò)程中,一批創(chuàng)業(yè)企業(yè)已經(jīng)開始「AI原生」,甚至是一出生就長(zhǎng)在大模型上。
根據(jù)Gartner預(yù)測(cè),到2026年,超過(guò)80%的企業(yè)將在生產(chǎn)環(huán)境中采用生成式AI的API、模型,并部署啟用生成式AI應(yīng)用——這些都指向了AI原生應(yīng)用的機(jī)遇。
但是問(wèn)題來(lái)了,AI原生企業(yè)在選擇算力方案時(shí)會(huì)面臨一系列的算力問(wèn)題。在這次 AI Summit上,從業(yè)者一致認(rèn)為,算力挑戰(zhàn)是普遍現(xiàn)象,「算力成本」是主要門檻。上海人工智能實(shí)驗(yàn)室、訓(xùn)練框架與編譯技術(shù)負(fù)責(zé)人裴芝林在活動(dòng)上提及了3個(gè)算力成本問(wèn)題:
第一,硬件選型成本,如何選擇和自己業(yè)務(wù)匹配的芯片,以最小的成本服務(wù)用戶;
第二,軟件在應(yīng)用層面的研發(fā)投入成本,如何打通軟件開發(fā)到應(yīng)用落地的最后一步;
第三,如何發(fā)揮軟件+硬件的成本效率,達(dá)到易用性。
為此,英特爾中國(guó)軟件技術(shù)合作事業(yè)部高級(jí)總監(jiān)劉斌總結(jié)說(shuō)道,這些企業(yè)需要以下解決方案,即:非單一GPU來(lái)源的“更多可靠選擇;以適用既有軟件資產(chǎn)和網(wǎng)絡(luò)條件的“穩(wěn)定可持續(xù)”;在保持較低基礎(chǔ)架構(gòu)成本的前提下的“可擴(kuò)展”;可以解決多種業(yè)務(wù)挑戰(zhàn)的“效益最大化”。
不過(guò),方案再好,也需要在交付環(huán)節(jié)同樣“靠譜”。對(duì)此,英特爾也給出了全方位的應(yīng)對(duì)之策。
策略之一,根據(jù)業(yè)務(wù)場(chǎng)景需求,提供成本更優(yōu)的算力方案。
如今AI大模型的訓(xùn)練和推理動(dòng)輒需要千卡乃至萬(wàn)卡,而一張GPU卡動(dòng)輒幾萬(wàn)、十幾萬(wàn)乃至二十幾萬(wàn),對(duì)于AI原生企業(yè)來(lái)說(shuō),如果盲目選擇GPU服務(wù)器算力,將會(huì)面對(duì)巨大的試錯(cuò)成本。
英特爾提供了堆GPU之外的另一個(gè)選擇——CPU。
為了滿足不同工作負(fù)載的需求,最新登場(chǎng)的至強(qiáng)® 6采用了兩種微架構(gòu)——E-core(能效核)和P-core(性能核)。E-core的功耗更低,適用于微服務(wù)等傳統(tǒng)后端應(yīng)用場(chǎng)景,而P-core擁有高達(dá)128個(gè)內(nèi)核和504MB的超大L3緩存,可為AI、數(shù)據(jù)分析、科學(xué)計(jì)算等計(jì)算密集型業(yè)務(wù)提供卓越的性能支持。
在9月26日英特爾剛剛舉辦的至強(qiáng)® 6性能核處理器發(fā)布會(huì)上,英特爾數(shù)據(jù)中心與人工智能集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立介紹:“英特爾在設(shè)計(jì)處理器時(shí),會(huì)分別設(shè)計(jì)兩個(gè)單元——計(jì)算單元和I/O單元。”二者解耦的分離式模塊化設(shè)計(jì),可靈活組合不同數(shù)量的計(jì)算單元,實(shí)現(xiàn)核心數(shù)量的擴(kuò)展及內(nèi)存和I/O的同步強(qiáng)化,保證更優(yōu)的整體性能和能效。
至強(qiáng)® 除了能兼顧通用計(jì)算、兼顧AI推理之外,還能作為機(jī)頭處理器與AI加速器或GPU協(xié)作,面向AI企業(yè)、AI創(chuàng)造者多元化地推出算力組合,提供端到端方案,解決AI原生企業(yè)面臨的算力成本問(wèn)題。
在云端算力方面,英特爾提供了至強(qiáng)® (內(nèi)置AI加速器)和Gaudi® 組合的方案,充分利用企業(yè)既有IT基礎(chǔ)設(shè)施的同時(shí),提供了更具性價(jià)比的AI落地方案。
以英特爾®Gaudi® 為例,它是一個(gè)AI專用處理器,專為生成式AI和大模型而生。作為一款完全可編程的高性能AI加速器,Gaudi®融合了多種技術(shù)創(chuàng)新,具有高內(nèi)存帶寬/容量,還擁有較好的可擴(kuò)展性,能夠支持輕松高效的網(wǎng)絡(luò)功能。Gaudi®可以支持絕大多數(shù)大模型,擁有較成熟的軟件生態(tài),英特爾提供的軟件套件也會(huì)幫助AI模型的開發(fā)和部署,從而讓企業(yè)接入的時(shí)候更容易。
隨著AI算力向桌面端的滲透,在邊緣端和端側(cè)的算力方面,英特爾同樣有酷睿™ Ultra和ARC™ 提供全方位的硬件平臺(tái)加持。
其中,酷睿™ Ultra是英特爾客戶端處理器路線圖的一個(gè)轉(zhuǎn)折點(diǎn)。該款處理器通過(guò)集成英特爾® 銳炫™ 顯卡帶來(lái)了獨(dú)立顯卡級(jí)別的性能。而且它還配備了英特爾首款集成的神經(jīng)網(wǎng)絡(luò)處理器(NPU),用于在PC上帶來(lái)高能效的AI加速和本地推理體驗(yàn)。
“本質(zhì)上,這是一個(gè)算力和成本的選擇。針對(duì)大模型的推理,智算中心的建設(shè),可以優(yōu)先看至強(qiáng)處理器和Gaudi® AI加速器;而針對(duì)端側(cè),酷睿™ Ultra則提供了更佳選擇,它集成了GPU+NPU的能力,算力最高可達(dá)120TPOS。”劉斌補(bǔ)充說(shuō)道。
顯然,無(wú)論是在數(shù)據(jù)中心、云端、還AI PC在內(nèi)的端側(cè),英特爾都能提供成本更優(yōu)的算力方案。
策略二,打造開放共贏的企業(yè)AI平臺(tái)。
當(dāng)然,英特爾所做的,并不止于降本扶持。今年6月,英特爾聯(lián)合行業(yè)領(lǐng)先企業(yè)最新推出了“企業(yè)AI開放平臺(tái),Open Platform of Enterprise AI (OPEA)”。該平臺(tái)集成了API參考代碼、異構(gòu)硬件等高效技術(shù)支持,并提供參考工作流程、規(guī)范等多種服務(wù),這為軟硬件提供商等不同的生態(tài)角色提供了豐富的價(jià)值,如降低研發(fā)成本、多樣化軟硬件供應(yīng)鏈、聚焦模塊創(chuàng)新、助力系統(tǒng)級(jí)交付、實(shí)現(xiàn)便捷靈活部署、加速產(chǎn)品推向市場(chǎng)和迭代等。
目前,OPEA已成為L(zhǎng)inux Foundation AI & Data旗下的重要開源項(xiàng)目,以期凝聚行業(yè)動(dòng)能,共同減少生成式AI生態(tài)系統(tǒng)的復(fù)雜性,幫助企業(yè)通過(guò)生成式AI更快、更輕松地從自有數(shù)據(jù)中解鎖價(jià)值,促使企業(yè)AI解決方案能夠更快捷地落地。
“無(wú)論是基于云原生的架構(gòu),還是AI原生的架構(gòu),OPEA都是最開放的框架,它本身沒有任何的商業(yè)含義,它的初衷是用一個(gè)更純粹的方式讓大家互惠互通。”劉斌強(qiáng)調(diào)。
技術(shù)支持,聯(lián)合市場(chǎng)推廣,加速業(yè)務(wù)增長(zhǎng)
為了幫助企業(yè)更好的利用算力資源,英特爾一方面提供CPU指令集調(diào)用,OS kernel層開發(fā),底層資源庫(kù)的調(diào)用等技術(shù)支持,另一方面提供多種工具開發(fā)包,套件,函數(shù)庫(kù),等等,用于幫助完成軟件優(yōu)化和研發(fā)。
當(dāng)合作伙伴的產(chǎn)品或方案進(jìn)入市場(chǎng),英特爾市場(chǎng)部會(huì)提供營(yíng)銷支持,通過(guò)案例推廣、產(chǎn)品聯(lián)合發(fā)布、媒體宣傳、線下需求對(duì)接會(huì)等多種方式進(jìn)行宣傳推廣,幫助合作伙伴的產(chǎn)品打開市場(chǎng),獲取商機(jī)。
誠(chéng)然,從云原生、到AI原生的背后,也是從基礎(chǔ)設(shè)施的優(yōu)化、到應(yīng)用層面智能的轉(zhuǎn)變。其中,云原生提供了強(qiáng)大的基礎(chǔ)設(shè)施支持,為AI原生應(yīng)用的開發(fā)和運(yùn)行提供了基礎(chǔ)。而AI原生則在此基礎(chǔ)上,通過(guò)集成大模型、生成式AI等技術(shù),使得應(yīng)用程序能夠提供更加智能化的服務(wù)和體驗(yàn)。
新算力 重新定義新硬件
算力無(wú)所不在,不僅在創(chuàng)造原生應(yīng)用,也在重新定義硬件,AIPC就是一個(gè)例子。
如同云計(jì)算在逐漸由云端主導(dǎo)過(guò)渡到邊云協(xié)同,另外一方面,AI算力也將從數(shù)據(jù)中心逐漸向端側(cè)延伸。在這當(dāng)中,AIPC是其中的重要一環(huán)。此前英特爾預(yù)言,到2028年80%的PC將成為AI PC。
可見,PC正在AI時(shí)代重新煥發(fā)光彩。AIDC(AI算力中心)和AIPC(AI個(gè)人電腦),二者也相得益彰。
在云端,算力成本將隨著用戶量的增加而變得更加顯性,AIPC有機(jī)會(huì)把一些不需要大量計(jì)算、對(duì)實(shí)時(shí)性要求不高、但需要及時(shí)反饋的日常需求用端側(cè)的算力來(lái)解決,數(shù)據(jù)不出端,既保證了數(shù)據(jù)安全,又極大地降低企業(yè)部署的成本。
舉例而言,假設(shè)一家涉及設(shè)計(jì)IP的企業(yè),每個(gè)員工每天要向云端模型密集提問(wèn),為企業(yè)增加了訂閱或者Token費(fèi)用的同時(shí),隱私安全也是繞不過(guò)的門檻。但如果這家企業(yè)的每個(gè)員工升級(jí)了AI PC,短期看成本或許會(huì)增加,但長(zhǎng)期看其實(shí)降低了成本,優(yōu)化了場(chǎng)景適配。
新生態(tài),賦能新應(yīng)用
無(wú)論是云原生,還是AI原生,關(guān)鍵都在于應(yīng)用場(chǎng)景。因?yàn)橹挥挟?dāng)技術(shù)“能用”,才能發(fā)揮它真正的價(jià)值,這也是為什么創(chuàng)業(yè)公司永遠(yuǎn)在追求PMF(產(chǎn)品市場(chǎng)驗(yàn)證)的原因。
軟積木創(chuàng)始人、微軟MVP黃海峰在此活動(dòng)上指出,“除了要把算力平臺(tái)運(yùn)行起來(lái),更重要的還是轉(zhuǎn)換成生產(chǎn)力,給社會(huì)、企業(yè)帶來(lái)價(jià)值,要通過(guò)AI的應(yīng)用去解決,通過(guò)平臺(tái)去解決。”
對(duì)此,英特爾也一直在賦能軟件生態(tài)建設(shè)。在AI產(chǎn)品布局的最上層“應(yīng)用層”,英特爾提供了豐富的軟件工具來(lái)加速AI發(fā)展,比如英特爾® oneAPI AI Analytics 工具套件、BigDL 和 OpenVINO™ 工具套件等,不僅能為開發(fā)者提供強(qiáng)大的AI開發(fā)和推理能力,也為跨英特爾硬件的異構(gòu)執(zhí)行提供支持。
值得一提的是,這些工具中的大部分都是開源軟件。作為L(zhǎng)inux Kernel、Kubernetes、云原生等領(lǐng)域的主要貢獻(xiàn)者,英特爾不止一次對(duì)外強(qiáng)調(diào),對(duì)于開源軟件生態(tài)的建設(shè)與重視,通過(guò)與生態(tài)合作伙伴的開放的共贏的關(guān)系,為企業(yè)提供最好的解決方案。
當(dāng)然,為了挖掘AIPC的更多應(yīng)用場(chǎng)景,除了給開發(fā)者提供工具,英特爾還為這些開發(fā)者提供土壤,鼓勵(lì)創(chuàng)新。
從去年12月起,英特爾與聯(lián)想開啟了英特爾人工智能創(chuàng)新應(yīng)用大賽,為AI時(shí)代開發(fā)者提供揮灑創(chuàng)意、展示成功的示范平臺(tái),讓AI惠及更多的終端用戶。
而在今年3月,英特爾還推出了“AI PC開發(fā)者計(jì)劃”,專門為軟件開發(fā)者和獨(dú)立軟件供應(yīng)商設(shè)計(jì),以求為其提供流暢的開發(fā)體驗(yàn),幫助開發(fā)者更容易地實(shí)現(xiàn)新型AI技術(shù)的大規(guī)模應(yīng)用。
總結(jié)而言,英特爾持續(xù)在“用CPU加速AI”,而且除了CPU之外,英特爾也在GPU、AI專用加速芯片上不斷研發(fā)和創(chuàng)新,以其全棧算力為客戶提供更具性價(jià)比的方案、為創(chuàng)建綠色數(shù)據(jù)中心、開發(fā)軟件和工具提供源源不斷的支持。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。