6月13日SUSE Summit 2025創(chuàng)新峰會(huì)上,SUSE亞太區(qū)CTO Vishal Ghariwala拋出了一個(gè)引人深思的比喻:“沒(méi)有清晰的視野,企業(yè)就像一匹盲馬,容易失誤并害怕前行。”
據(jù)IDC預(yù)測(cè),亞太地區(qū)AI投資到2028年將達(dá)1750億美元,但現(xiàn)實(shí)截至2025年1月份,僅有44%的PoC(概念驗(yàn)證)能進(jìn)入生產(chǎn)環(huán)節(jié),預(yù)計(jì)到2027年,60%的生成式AI項(xiàng)目將在PoC階段后被放棄。巨大的投資與慘淡的成功率形成鮮明對(duì)比,這正是當(dāng)下企業(yè)AI創(chuàng)新面臨的最大悖論。
Vishal的使命很清晰:用開(kāi)源的力量拆掉阻礙企業(yè)AI落地的無(wú)形圍墻。在他看來(lái),企業(yè)對(duì)AI的恐懼源自未知,而破解未知的鑰匙,就藏在“AI平臺(tái)+開(kāi)源”這個(gè)看似簡(jiǎn)單的公式里。
迷霧重重——企業(yè)AI落地的三層困境
在Vishal看來(lái),這種恐懼具體表現(xiàn)為三個(gè)層面。
第一層是成本困境。“目前云的成本正在不斷攀升,有一個(gè)趨勢(shì)是,很多的客戶(hù)正把自己的應(yīng)用、數(shù)據(jù)從云端搬回到本地”Vishal觀察到的這個(gè)現(xiàn)象,正在成為企業(yè)AI部署的新常態(tài)。傳統(tǒng)的云端AI服務(wù)雖然看起來(lái)便捷,但隨著使用規(guī)模的擴(kuò)大,成本往往呈指數(shù)級(jí)增長(zhǎng),讓許多企業(yè)望而卻步。
第二層是安全困境。“如果提示語(yǔ)能夠有巧妙的編排,甚至能夠獲取到一些敏感的比如信用卡的信息。”Vishal用一個(gè)具體的例子說(shuō)明了企業(yè)對(duì)AI安全的擔(dān)憂(yōu)并非杞人憂(yōu)天。當(dāng)企業(yè)的核心數(shù)據(jù)成為AI訓(xùn)練的素材,當(dāng)模型的輸出可能泄露商業(yè)機(jī)密,信任危機(jī)就成了AI普及的最大障礙。
第三層則是選擇困境。開(kāi)源世界的繁榮帶來(lái)了豐富的選擇,但也帶來(lái)了選擇的焦慮。“客戶(hù)往往因選擇過(guò)多而無(wú)從下手,例如不清楚哪些場(chǎng)景適合使用專(zhuān)有工具,哪些可以使用開(kāi)源工具。”面對(duì)Keras、PyTorch等眾多開(kāi)源框架,以及vLLM、Ollama等各種推理引擎,企業(yè)的技術(shù)團(tuán)隊(duì)常常陷入分析癱瘓的狀態(tài)。
這三層困境交織在一起,便構(gòu)成了企業(yè)AI落地道路上的厚重圍墻。
破局之道——“AI平臺(tái)+開(kāi)源”的三重價(jià)值
面對(duì)這些困境,Vishal提出的解決方案簡(jiǎn)潔而深刻:“AI平臺(tái)+開(kāi)源”。
在他的闡述中,這個(gè)公式的第一重價(jià)值是成本優(yōu)化。“有了Rancher Prime,就可以從成本的角度選擇某一個(gè)具體的工作負(fù)載部署在本地、云端還是邊緣。”
這種靈活性讓企業(yè)重新獲得了主動(dòng)權(quán)。不再是被迫接受云服務(wù)商的定價(jià)策略,而是可以根據(jù)自身的成本結(jié)構(gòu)和業(yè)務(wù)需求,自主選擇最優(yōu)的部署方式。
第二重價(jià)值是安全保障。Vishal詳細(xì)介紹了SUSE的安全防護(hù)體系:“SUSE Security能夠保護(hù)客戶(hù)的AI平臺(tái)不受零日攻擊這樣的安全漏洞風(fēng)險(xiǎn),使得非法分子無(wú)法竊取受到SUSE Security保護(hù)的客戶(hù)的數(shù)據(jù)。”不僅如此,當(dāng)系統(tǒng)發(fā)現(xiàn)網(wǎng)絡(luò)中流傳敏感信息時(shí),會(huì)立即進(jìn)行攔截。
而SUSE GuardRails則從另一個(gè)角度提供保護(hù),“確保客戶(hù)的LLM的模型的輸出是安全的,有時(shí)候模型輸出的結(jié)果會(huì)帶有一定的偏見(jiàn),GuardRails可以確保輸出達(dá)到了負(fù)責(zé)任的AI輸出的準(zhǔn)則。”
第三重價(jià)值是選擇自由。“SUSE憑借多年的開(kāi)源社區(qū)開(kāi)發(fā)經(jīng)驗(yàn),能夠?qū)⑦@些開(kāi)源項(xiàng)目提升至企業(yè)級(jí)質(zhì)量水平,確保其在AI領(lǐng)域的應(yīng)用價(jià)值。”這種能力轉(zhuǎn)化體現(xiàn)在多個(gè)方面:為開(kāi)源項(xiàng)目提供企業(yè)級(jí)支持,確保其安全性,定期進(jìn)行安全升級(jí)和補(bǔ)丁更新,以及保持版本的周期性發(fā)布。
更重要的是,“對(duì)于客戶(hù)而言,他們只需安裝一個(gè)具體的平臺(tái),所有的配置和設(shè)置都會(huì)自動(dòng)完成,無(wú)需手動(dòng)操作。”
這種價(jià)值已經(jīng)在實(shí)踐中得到驗(yàn)證。比如互聯(lián)網(wǎng)醫(yī)院皓康醫(yī)療,計(jì)劃采用SUSE AI作為其人工智能基礎(chǔ)設(shè)施,用于運(yùn)行醫(yī)學(xué)影像分析和醫(yī)學(xué)診斷生成,旨在提升診斷準(zhǔn)確性、減少人為錯(cuò)誤。
德國(guó)FIS集團(tuán)借助SUSE AI構(gòu)建了面向SAP工作負(fù)載的可信AI解決方案,實(shí)現(xiàn)了令牌使用、模型性能、GPU利用率的全鏈路可視化。正如其AI能力團(tuán)隊(duì)負(fù)責(zé)人所說(shuō):“SUSE AI顯著降低了運(yùn)行AI工作負(fù)載的復(fù)雜性,我們能通過(guò)中央平臺(tái)管理不同大語(yǔ)言模型,并按需快速為客戶(hù)部署新模型。”
可觀測(cè)性驅(qū)動(dòng)的智能運(yùn)營(yíng)
SUSE的視野并不止于解決當(dāng)前問(wèn)題,更致力于創(chuàng)造AI時(shí)代的企業(yè)運(yùn)營(yíng)新范式。
“可觀測(cè)性未來(lái)必須具備的一種能力就是可以把不同的離散化的環(huán)境中的一些核心的衡量指標(biāo)進(jìn)行整合,整合到一個(gè)統(tǒng)一的管理的平臺(tái)之上。”在Vishal看來(lái),隨著企業(yè)IT環(huán)境日趨復(fù)雜,傳統(tǒng)的運(yùn)維方式已經(jīng)無(wú)法應(yīng)對(duì)混合云、多云以及邊緣計(jì)算帶來(lái)的挑戰(zhàn)。
更關(guān)鍵的是,可觀測(cè)性的能力必須跨應(yīng)用和基礎(chǔ)設(shè)施兩個(gè)層次。“有時(shí)候一個(gè)應(yīng)用崩潰了,如果只是找應(yīng)用本身的問(wèn)題,是無(wú)法追根溯源的,因?yàn)楹芸赡軉?wèn)題來(lái)自于基礎(chǔ)設(shè)施。”這種360度的可視性要求平臺(tái)能夠提供從基礎(chǔ)設(shè)施到應(yīng)用層的全堆棧洞察。
人工智能技術(shù)在這個(gè)過(guò)程中扮演著重要角色。“我們需要利用AI Correlation來(lái)追根溯源。”面對(duì)來(lái)自數(shù)據(jù)庫(kù)、應(yīng)用程序、防火墻等不同系統(tǒng)的大量警報(bào),傳統(tǒng)的人工分析方式顯然力不從心。AI驅(qū)動(dòng)的關(guān)聯(lián)分析能夠快速識(shí)別問(wèn)題的根本原因,大幅提升運(yùn)維效率。
成本透明化是可觀測(cè)性的另一個(gè)重要維度。“這種成本透明化可以幫助企業(yè)更好地了解云成本,例如,如果在公有云上運(yùn)行成本過(guò)高,企業(yè)可以選擇將其遷移到私有云。”通過(guò)集成OpenCost等開(kāi)源工具,SUSE Observability能夠讓運(yùn)營(yíng)團(tuán)隊(duì)掌握IT基礎(chǔ)設(shè)施的健康狀況,同時(shí)讓業(yè)務(wù)團(tuán)隊(duì)了解應(yīng)用在不同環(huán)境下的運(yùn)行成本,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的決策。
中國(guó)信保的實(shí)踐很好地詮釋了這種新范式的價(jià)值。這家大型金融機(jī)構(gòu)基于SUSE Rancher和Kubernetes實(shí)現(xiàn)云原生架構(gòu)升級(jí),不僅提高了容器資源管理效率,還增強(qiáng)了應(yīng)用的可觀測(cè)性和安全性。正如其資深技術(shù)專(zhuān)家所言:“開(kāi)源技術(shù)為我們構(gòu)筑可持續(xù)的技術(shù)架構(gòu)、推動(dòng)持續(xù)性技術(shù)創(chuàng)新、加強(qiáng)自主可控提供了強(qiáng)有力的方法論支撐。”
重塑企業(yè)技術(shù)選擇權(quán)
許多開(kāi)源項(xiàng)目最初由少數(shù)開(kāi)發(fā)人員在非企業(yè)級(jí)環(huán)境中自發(fā)開(kāi)發(fā)。SUSE認(rèn)為,企業(yè)在選擇開(kāi)源項(xiàng)目時(shí),不能直接將其大規(guī)模部署到企業(yè)環(huán)境中,而是需要先進(jìn)行試驗(yàn),了解其運(yùn)行機(jī)制。雖然開(kāi)源項(xiàng)目的創(chuàng)新活力毋庸置疑,但企業(yè)級(jí)應(yīng)用需要的穩(wěn)定性、安全性和可支持性,往往是社區(qū)版本難以提供的。
“我們將上游社區(qū)的開(kāi)源項(xiàng)目引入下游,首先由SUSE的工程師檢查是否存在安全漏洞。在企業(yè)客戶(hù)使用過(guò)程中,如果發(fā)現(xiàn)安全漏洞,SUSE的工程師會(huì)負(fù)責(zé)打補(bǔ)丁,并將安全補(bǔ)丁推送給客戶(hù)。”這種“橋梁”作用正是SUSE的核心價(jià)值所在:既保持了開(kāi)源的創(chuàng)新活力,又提供了企業(yè)級(jí)的質(zhì)量保證。
對(duì)于中國(guó)市場(chǎng),SUSE表現(xiàn)出足夠的重視和信心。正如SUSE CEO Dirk-Peter van Leeuwen在開(kāi)幕致辭中所強(qiáng)調(diào)的,SUSE將持續(xù)增加對(duì)中國(guó)市場(chǎng)的投入,繼續(xù)加強(qiáng)本土化技術(shù)和服務(wù)團(tuán)隊(duì)的建設(shè),助力中國(guó)企業(yè)持續(xù)創(chuàng)新和發(fā)展。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話(huà)多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。