2025年,具備深度思考能力的DeepSeek的問(wèn)世,讓大模型在商業(yè)落地過(guò)程中,有了處理復(fù)雜任務(wù)的能力。
然而,面對(duì)大模型技術(shù)的日新月異,當(dāng)越來(lái)越多開發(fā)者、開發(fā)團(tuán)隊(duì)著手基于大模型開發(fā)應(yīng)用,乃至AI智能體時(shí),如何用較低成本、開發(fā)出符合這個(gè)時(shí)代的AI智能體,就成了當(dāng)下大多數(shù)開發(fā)者不得不面對(duì)的問(wèn)題。
也是在這樣的背景下,基于英特爾至強(qiáng)6性能核的火山引擎第四代計(jì)算實(shí)例g4il提出了“一杯咖啡的成本,在云上構(gòu)建專屬大模型知識(shí)庫(kù)”,似是有意解決這一問(wèn)題。
近日,我們與英特爾技術(shù)專家進(jìn)行了一次技術(shù)交流。
據(jù)英特爾技術(shù)專家透露,“英特爾已經(jīng)基于火山引擎第四代計(jì)算實(shí)例g4il進(jìn)行了一系列測(cè)試,我們現(xiàn)在已經(jīng)能夠做到在一個(gè)云實(shí)例里,僅使用CPU就可以運(yùn)行14B的大模型,這個(gè)門檻最低可以降到16vCPU或32vCPU,16vCPU在火山引擎官網(wǎng)的定價(jià)僅約3.8元/小時(shí)。”
這讓基于云計(jì)算的大模型應(yīng)用開發(fā)頗具誘惑力,也為大模型步入真正具備落地能力的Agentic AI時(shí)代奠定了基礎(chǔ)。
01 DeepSeek帶來(lái)的高效開發(fā)啟示
年初DeepSeek的出現(xiàn),不僅在各項(xiàng)能力上持續(xù)刷新業(yè)界對(duì)大模型潛能的認(rèn)知上限,更以其獨(dú)特的“深度思考”能力,為大模型應(yīng)用開發(fā)帶來(lái)了新思路。
DeepSeek的顯著特性之一是其高效的“蒸餾”技術(shù)。
通過(guò)這種技術(shù),即使是參數(shù)量相對(duì)較?。ㄈ?B或14B參數(shù))的大模型,也能夠展現(xiàn)出媲美甚至超越許多先前大模型的推理能力,這一點(diǎn)在DeepSeek-R1模型上得到了充分體現(xiàn)。
這種“小模型撬動(dòng)大智慧”的特性,使得DeepSeek在學(xué)習(xí)和開發(fā)階段具有極高的性價(jià)比,為更廣泛的開發(fā)者和研究者提供了接觸和使用先進(jìn)AI技術(shù)的機(jī)會(huì)。
面對(duì)大模型技術(shù)的飛速迭代,許多開發(fā)者和企業(yè)都感受到了前所未有的機(jī)遇與挑戰(zhàn)。
英特爾技術(shù)專家指出,“面對(duì)這股不可逆轉(zhuǎn)的趨勢(shì),與其在大模型本身研發(fā)上進(jìn)行‘內(nèi)卷’,不如將目光投向大模型應(yīng)用開發(fā)這一更廣闊的賽道。”
因?yàn)榇竽P捅旧硗枰c具體的應(yīng)用場(chǎng)景相結(jié)合,才能真正落地并發(fā)揮其價(jià)值。
投身大模型應(yīng)用開發(fā),不僅是緩解技術(shù)焦慮的有效途徑,更是提升自身價(jià)值、抓住時(shí)代機(jī)遇的關(guān)鍵一步。
然而,對(duì)于普通開發(fā)者而言,進(jìn)入大模型應(yīng)用開發(fā)領(lǐng)域并非易事,RAG、MCP、A2A等技術(shù)名詞層出不窮,技術(shù)棧的演進(jìn)速度也令人眼花繚亂,許多人因此望而卻步。
一方面認(rèn)為門檻過(guò)高,另一方面則苦于不知從何處入手,這種困境是當(dāng)前AI普惠化過(guò)程中亟待解決的現(xiàn)實(shí)問(wèn)題。
DeepSeek的成功也為模型架構(gòu)的創(chuàng)新提供了啟示。
DeepSeek采用的MoE混合專家架構(gòu)雖然并非首創(chuàng),但卻有力地驗(yàn)證了該架構(gòu)的有效性。
MoE架構(gòu)的特點(diǎn)在于,雖然模型總參數(shù)量可能大幅增加,但實(shí)際在推理過(guò)程中被激活的“有效參數(shù)”數(shù)量相對(duì)較少,這種機(jī)制使得模型能夠在不顯著增加算力需求的前提下,提升了性能和容量,實(shí)現(xiàn)了對(duì)計(jì)算資源的更高效利用。
英特爾技術(shù)專家特別指出,更值得關(guān)注的是DeepSeek所展現(xiàn)的“深度思考”能力,這意味著模型在處理復(fù)雜任務(wù)時(shí),不再僅僅是簡(jiǎn)單地根據(jù)輸入生成輸出,而是在內(nèi)部經(jīng)歷“規(guī)劃”和“思考”階段,然后再給出結(jié)果。
這種機(jī)制顯著提升了模型在復(fù)雜問(wèn)題解決和邏輯推理能力,也為接下來(lái)大模型的應(yīng)用普及奠定了基礎(chǔ)。
然而,如何解決大模型在開發(fā)、測(cè)試、驗(yàn)證過(guò)程中的算力開銷,降低大模型應(yīng)用的開發(fā)成本,依然是開發(fā)者不得不三思的問(wèn)題。
前不久,火山引擎云基礎(chǔ)團(tuán)隊(duì)官方表示,基于英特爾至強(qiáng)6性能核的火山引擎第四代計(jì)算實(shí)例g4il,已經(jīng)可以實(shí)現(xiàn)“一杯咖啡的成本,在云上構(gòu)建專屬大模型知識(shí)庫(kù)”。
這為大模型應(yīng)用開發(fā)者們帶來(lái)了一個(gè)低成本選項(xiàng)。
02 異構(gòu)計(jì)算趨勢(shì)下,CPU如何發(fā)光發(fā)熱?
同樣是做AI推理,如何比較CPU和GPU的性能差異?
這是大模型應(yīng)用開發(fā)者面臨的一個(gè)問(wèn)題,也是英特爾這樣的算力供應(yīng)商需要考慮的問(wèn)題。
英特爾技術(shù)專家指出,“本質(zhì)上CPU可以理解為一把‘瑞士軍刀’,是一個(gè)通用型計(jì)算設(shè)備,能夠執(zhí)行多種任務(wù),我們也對(duì)英特爾至強(qiáng)6性能核的AI推理進(jìn)行了加強(qiáng),使其相比其他CPU有了專門做矩陣運(yùn)算的AI加速器,GPU則更像一個(gè)專注于并行計(jì)算和AI加速的‘專家工具’。”
不過(guò),英特爾技術(shù)專家也指出,“當(dāng)前業(yè)界的普遍趨勢(shì)是采用異構(gòu)計(jì)算方案,即根據(jù)任務(wù)特性,讓CPU和GPU協(xié)同工作,各展所長(zhǎng)。”
CPU的優(yōu)勢(shì)在于其低成本、易獲得性,以及能夠滿足多數(shù)場(chǎng)景下的基本AI推理需求,特別是在GPU資源有限或不易獲取,或者僅需進(jìn)行小規(guī)模模型推理及特定AI場(chǎng)景應(yīng)用時(shí)。
即便在GPU資源充足的情況下,CPU依然可以與GPU協(xié)同工作,承擔(dān)數(shù)據(jù)預(yù)處理、任務(wù)調(diào)度、部分輕量級(jí)模型推理等任務(wù),而非簡(jiǎn)單的替代關(guān)系。
CPU與GPU協(xié)同的異構(gòu)計(jì)算方案,實(shí)際上已經(jīng)是當(dāng)下技術(shù)發(fā)展的主流方向。
大模型應(yīng)用的生命周期通常包括開發(fā)、驗(yàn)證和大規(guī)模生產(chǎn)部署三個(gè)階段,在對(duì)算力性能要求相對(duì)較低的開發(fā)和驗(yàn)證階段,CPU的低成本和易獲得性使其成為理想的選擇。
正因如此,基于英特爾至強(qiáng)6性能核的火山引擎第四代計(jì)算實(shí)例g4il意在充分發(fā)揮CPU的這些優(yōu)勢(shì),火山引擎聯(lián)合因特爾共同打造了面向大模型應(yīng)用的開發(fā)環(huán)境,并整合了豐富的應(yīng)用鏡像,將其包裝成一個(gè)完整的解決方案,旨在降低開發(fā)者入門的門檻。
英特爾技術(shù)專家指出,進(jìn)行大模型應(yīng)用開發(fā)需要具備三大要素:
用于驗(yàn)證和練習(xí)的硬件環(huán)境,主流軟件棧的兼容支持,以及一個(gè)好老師。
為了幫助開發(fā)者跨越這“第一步”,英特爾與火山引擎致基于g4il實(shí)例就三大要素進(jìn)行了如下布局:
硬件環(huán)境方面,火山引擎g4il實(shí)例搭載了先進(jìn)的英特爾至強(qiáng)6處理器,內(nèi)置AMX AI加速器,通過(guò)AMX的硬件加速能力,用戶在配置更低、更經(jīng)濟(jì)的虛擬機(jī)上也能獲得流暢的大模型應(yīng)用體驗(yàn)。
例如,針對(duì)DeepSeek的7B、14B參數(shù)的小尺寸模型,通過(guò)軟硬件協(xié)同優(yōu)化,可以在不依賴GPU的情況下,僅使用CPU(如16vCPU或32vCPU的g4il實(shí)例)即可實(shí)現(xiàn)每秒7個(gè)token以上的流暢輸出速度。
據(jù)悉,基于英特爾至強(qiáng)6性能核的g4il實(shí)例已經(jīng)正式發(fā)售。
在火山引擎官網(wǎng)上,一個(gè)16vCPU的g4il實(shí)例定價(jià)約為每小時(shí)3.8元,極大地降低了開發(fā)者的硬件成本。
軟件棧方面,英特爾發(fā)起的OPEA開源社區(qū)致力于利用開放架構(gòu)和組件化、模塊化的思想,旨在為企業(yè)打造可擴(kuò)展的AI應(yīng)用部署基礎(chǔ)。
OPEA社區(qū)積累了大量經(jīng)過(guò)預(yù)先驗(yàn)證和優(yōu)化的開源應(yīng)用范例,可供用戶參考。
英特爾與火山引擎將這些范例和必要的軟件棧打包成虛擬機(jī)鏡像,用戶在火山引擎控制臺(tái)選擇g4il實(shí)例后,可以直接選用預(yù)置的知識(shí)庫(kù)問(wèn)答等AI應(yīng)用鏡像,實(shí)現(xiàn)一鍵部署。
據(jù)英特爾技術(shù)專家透露,“通過(guò)一鍵部署,原本可能需要數(shù)天才能完成的環(huán)境搭建過(guò)程,如今可以縮短至3分鐘左右。”
課程指導(dǎo)方面,英特爾準(zhǔn)備了豐富的演示課程和技術(shù)文檔,內(nèi)容涵蓋從基礎(chǔ)環(huán)境搭建、代碼開發(fā)環(huán)境配置,到模型調(diào)優(yōu)、性能優(yōu)化等各個(gè)環(huán)節(jié)。
這些課程旨在幫助基礎(chǔ)相對(duì)薄弱的用戶補(bǔ)齊知識(shí)短板,理解技術(shù)原理,掌握實(shí)際操作技能,從而真正實(shí)現(xiàn)能力的進(jìn)階。
據(jù)悉,這些課程在英特爾官網(wǎng)上免費(fèi)開放給所有用戶。
正是基于這三大要素的構(gòu)建,火山引擎云基礎(chǔ)團(tuán)隊(duì)有了提出“一杯咖啡的成本,在云上構(gòu)建專屬大模型知識(shí)庫(kù)”的底氣,也為開發(fā)者提供了一條云上新路徑,一條高效通向Agentic AI的路徑。
好文章,需要你的鼓勵(lì)
AIM Intelligence聯(lián)合多所知名大學(xué)揭示了音頻AI系統(tǒng)的重大安全漏洞,開發(fā)出名為WhisperInject的攻擊方法。這種攻擊能讓看似無(wú)害的音頻指令操控AI生成危險(xiǎn)內(nèi)容,成功率超過(guò)86%,完全繞過(guò)現(xiàn)有安全機(jī)制。研究暴露了多模態(tài)AI系統(tǒng)的系統(tǒng)性安全風(fēng)險(xiǎn),對(duì)全球數(shù)十億智能設(shè)備構(gòu)成潛在威脅。
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)系統(tǒng)梳理了視覺強(qiáng)化學(xué)習(xí)領(lǐng)域的最新進(jìn)展,涵蓋超過(guò)200項(xiàng)代表性工作。研究將該領(lǐng)域歸納為四大方向:多模態(tài)大語(yǔ)言模型、視覺生成、統(tǒng)一模型框架和視覺-語(yǔ)言-動(dòng)作模型,分析了從RLHF到可驗(yàn)證獎(jiǎng)勵(lì)范式的政策優(yōu)化策略演進(jìn),并識(shí)別出樣本效率、泛化能力和安全部署等關(guān)鍵挑戰(zhàn),為這一快速發(fā)展的交叉學(xué)科提供了完整的技術(shù)地圖。
浙江大學(xué)研究團(tuán)隊(duì)通過(guò)OmniEAR基準(zhǔn)測(cè)試揭示了當(dāng)前AI模型在物理世界推理方面的嚴(yán)重缺陷。測(cè)試顯示,即使最先進(jìn)的AI在明確指令下能達(dá)到85-96%成功率,但面對(duì)需要從物理約束推斷行動(dòng)的任務(wù)時(shí),成功率驟降至56-85%。研究發(fā)現(xiàn)信息過(guò)載反而降低AI協(xié)作能力,監(jiān)督學(xué)習(xí)雖能改善單體任務(wù)但對(duì)多智能體協(xié)作效果甚微,表明當(dāng)前架構(gòu)存在根本局限性。
紐約大學(xué)和Aimpoint Digital Labs的研究團(tuán)隊(duì)首次揭示了Transformer模型訓(xùn)練中"大規(guī)模激活"的完整發(fā)展軌跡。這些影響力比普通激活大千倍的"超級(jí)激活"遵循可預(yù)測(cè)的數(shù)學(xué)規(guī)律,研究者開發(fā)出五參數(shù)公式能以98.4%準(zhǔn)確率預(yù)測(cè)其變化。更重要的是,通過(guò)調(diào)整模型架構(gòu)參數(shù)如注意力密度、寬深比等,可以在訓(xùn)練前就預(yù)測(cè)和控制這些關(guān)鍵激活的行為,為設(shè)計(jì)更高效、量化友好的AI模型提供了全新工具。
關(guān)注智造、硬件、機(jī)器人。