作者 | 周雅
20世紀(jì)的建筑大師德維希·密斯·凡·德羅,用一句“少即是多”(Less is more),定義了整個(gè)現(xiàn)代主義建筑的靈魂。他主張?zhí)蕹磺胁槐匾难b飾,用最簡(jiǎn)潔的結(jié)構(gòu)和材料,去展現(xiàn)建筑本身的力量感和空間美學(xué)。這種思想,不僅影響了建筑,更滲透到工業(yè)設(shè)計(jì)、藝術(shù)乃至生活哲學(xué)的方方面面。
然而,在過(guò)去很長(zhǎng)一段時(shí)間里,軟件開(kāi)發(fā)的世界,卻似乎走上了一條“多即是多”(More is more)的道路。我們發(fā)明了更多的編程語(yǔ)言、更多的框架、更多的設(shè)計(jì)模式、更多的中間件、更多的云服務(wù)……我們像一個(gè)焦慮的收藏家,不斷地往自己的工具箱里添加新東西,試圖用更復(fù)雜的工具,去解決更復(fù)雜的問(wèn)題。
開(kāi)發(fā)者的工作,變成了一場(chǎng)復(fù)雜性的競(jìng)賽。
但今年的Google I/O Connect China大會(huì),似乎軟件開(kāi)發(fā)又開(kāi)始走向“極簡(jiǎn)主義”時(shí)代。在這背后,開(kāi)發(fā)者不再需要無(wú)休止地做加法,而是開(kāi)始有策略、有智慧地做減法。
Google 大中華區(qū)及韓國(guó)總裁陳俊廷在致辭中指出,中國(guó)出海開(kāi)發(fā)者已成為全球創(chuàng)新舞臺(tái)上不可或缺的中堅(jiān)力量。無(wú)論是初創(chuàng)公司還是大型企業(yè),在 Google 全棧式 AI 解決方案和全球化生態(tài)支持下,在全球市場(chǎng)取得了顯著成功。
第一重減法:讓開(kāi)發(fā)化繁為簡(jiǎn)
在傳統(tǒng)的軟件開(kāi)發(fā)模式中,開(kāi)發(fā)者的工作主要集中在“如何實(shí)現(xiàn)”層面:寫代碼、調(diào)試錯(cuò)誤、優(yōu)化性能。隨著技術(shù)棧越來(lái)越復(fù)雜,開(kāi)發(fā)者的注意力被越來(lái)越多地分散到工具鏈、依賴管理、跨平臺(tái)適配等次要但必須的任務(wù)上。就像一位建筑師,本該專注于建筑的美感與功能,卻被迫花大量時(shí)間去研究水泥配比和鋼筋規(guī)格。
在I/O Connect China會(huì)上,谷歌展示了AI如何優(yōu)化這一過(guò)程,讓開(kāi)發(fā)者更多思考“做什么”,而非“怎么做”。這套減法的核心,是Google的大模型矩陣。
首先就是Gemini大模型家族。它相當(dāng)于一個(gè)超級(jí)大腦,為最大規(guī)模、最復(fù)雜的創(chuàng)新提供源動(dòng)力,目前它已經(jīng)更新到2.5版本,包括三種規(guī)格:
· Gemini 2.5 Pro,能力最強(qiáng)的旗艦?zāi)P停?/p>
· Gemini 2.5 Flash,為速度與性能平衡而生,適用于日常高頻任務(wù);
· Gemini 2.5 Flash-Lite,則專為大規(guī)模、低成本的場(chǎng)景打造,具有極高性價(jià)比。
其次,如果說(shuō)閉源的Gemini是超級(jí)大腦,那么開(kāi)源的Gemma則是其向外延伸的神經(jīng)網(wǎng)絡(luò)。Google 開(kāi)發(fā)者關(guān)系與開(kāi)源業(yè)務(wù)總監(jiān) Timothy Jordan用“Gemmaverse”(Gemma宇宙)來(lái)形容這個(gè)充滿活力的社區(qū)生態(tài),自2024年3月發(fā)布以來(lái),Gemma的下載量已超過(guò)2億次,催生了超過(guò)8萬(wàn)個(gè)衍生模型,它不再局限于商業(yè)巨頭,而是滲透到社會(huì)的各個(gè)角落。
Timothy舉了兩個(gè)案例:阿里巴巴國(guó)際站基于Gemma構(gòu)建了圖文模型Ovis1.6,提升了其全球業(yè)務(wù)流程和效率;同時(shí),小米也開(kāi)發(fā)了Gemma X模型,專注于解決多對(duì)多跨語(yǔ)言翻譯場(chǎng)景,為其全球化市場(chǎng)服務(wù)。
當(dāng)然,Gemma的意義遠(yuǎn)不止于商業(yè),它也讓AI觸及到那些最需要技術(shù)溫度的角落:
· 為了溝通無(wú)礙:香港開(kāi)發(fā)者Impact AI的使命是消除各種溝通障礙,他們利用Gemma構(gòu)建了一個(gè)智能手語(yǔ)“數(shù)字人”,將中文文本實(shí)時(shí)翻譯成富有表現(xiàn)力的香港手語(yǔ)。在香港,僅有一所聾啞學(xué)校,這項(xiàng)技術(shù)正在改變特殊群體的教學(xué)、學(xué)習(xí)和社交方式。
· 為了文化傳承:萊頓大學(xué)的研究者們,利用Gemma 2開(kāi)發(fā)了一套“敦煌文化智能體”,它能以不同風(fēng)格生成回答,讓沉睡千年的敦煌歷史,以一種可交互、可感知的方式,在數(shù)字世界煥發(fā)新生。
· 為了藝術(shù)表達(dá):藝術(shù)家鄔建安借助Gemma創(chuàng)作《72變》,打破了創(chuàng)作者與觀眾的溝通壁壘,將用戶內(nèi)心的自我表達(dá),實(shí)時(shí)轉(zhuǎn)化為流動(dòng)的視覺(jué)藝術(shù)。
如今,Gemma 3已經(jīng)成為全球頂尖的多模態(tài)開(kāi)放模型,支持超過(guò) 140 種語(yǔ)言,還衍生出多款面向不同場(chǎng)景的模型,譬如:
· Shield Gemma:用于安全部署大語(yǔ)言模型;
· Med Gemma:用于醫(yī)療領(lǐng)域的多模態(tài)模型,可處理醫(yī)療文本和影像,既能微調(diào)優(yōu)化醫(yī)療應(yīng)用,也能將它作為隱私保護(hù)工具在智能體系統(tǒng)中安全使用。
· Dolphin Gemma:科學(xué)家利用Gemma,開(kāi)發(fā)了全球首個(gè)“海豚語(yǔ)言”大模型 Dolphin Gemma。不開(kāi)玩笑,未來(lái)你或許真能和海豚聊天。
在端側(cè) AI 上,Google 還發(fā)布了 Gemma 3n,與新一代 Gemini Nano 采用相同架構(gòu),即使在只有2GB 內(nèi)存的設(shè)備上也能流暢運(yùn)行。
除了這些模型之外,Google還有三款生成式AI模型,包括音樂(lè)生成模型Lyric、圖片生成模型Imagen 4、以及視頻創(chuàng)作模型Veo 3。我在展區(qū)現(xiàn)場(chǎng)也體驗(yàn)了互動(dòng)演示Androidify,它先利用 Gemini 2.5 Pro分析我的照片并生成描述文字,然后將這段文字作為創(chuàng)作指令,提供給一個(gè)精心微調(diào)的Imagen模型,它可以將我的照片變成一個(gè)完全個(gè)性化的Android機(jī)器人形象。
我在Google I/O Connect China現(xiàn)場(chǎng)體驗(yàn)Androidify
第二重減法:掃清出海障礙
對(duì)于中國(guó)的開(kāi)發(fā)者和企業(yè)而言,走向全球市場(chǎng)是一條充滿機(jī)遇但同樣遍布荊棘的道路。語(yǔ)言、文化、技術(shù)、本地運(yùn)營(yíng)等都是需要跨越的障礙。Google的第二重減法,就是利用其全球化的平臺(tái)和生態(tài),系統(tǒng)性地為中國(guó)開(kāi)發(fā)者“減去”出海的門檻。
陳俊廷在演講中分享了一系列案例,展現(xiàn)了這套“減法”的實(shí)際效果:
1、基礎(chǔ)設(shè)施的減法:網(wǎng)易游戲的海外射擊大作,利用Google Cloud的全球算力,將服務(wù)器成本降低40%,全球響應(yīng)時(shí)間縮短67%,實(shí)現(xiàn)了無(wú)延遲的全球同服對(duì)戰(zhàn)。這減去的是企業(yè)自建全球基礎(chǔ)設(shè)施的巨大成本和技術(shù)壁壘。
2、技術(shù)應(yīng)用的減法:螞蟻集團(tuán)基于Vertex AI打造“AI即服務(wù)”平臺(tái),幫助海外金融科技公司構(gòu)建AI智能體,讓復(fù)雜的金融服務(wù)變得簡(jiǎn)單高效。此外,萬(wàn)興科技旗下的視頻編輯平臺(tái)Fumora(喵影工廠海外版),利用Gemini 2.5 Flash實(shí)現(xiàn)了創(chuàng)新的“AI一鍵剪輯”功能,并借助Gemini實(shí)現(xiàn)了智能取景,能夠分析視頻內(nèi)容并生成旁白,將一堆原始素材變成精彩的Vlog,同時(shí)Fumora使用Gemini模型也迭代了原有的復(fù)雜多模型架構(gòu),這使其集成速度加快了70%,同時(shí)用戶對(duì)AI生成內(nèi)容的滿意度也提升了32%。這減去的是企業(yè)在海外市場(chǎng)進(jìn)行AI技術(shù)研發(fā)和產(chǎn)品迭代的復(fù)雜周期。
3、市場(chǎng)拓展的減法:海外AI多模態(tài)娛樂(lè)社區(qū)CART,在Google AI賦能下,僅用兩年時(shí)間就實(shí)現(xiàn)了海外用戶100倍的增長(zhǎng)。這減去的是初創(chuàng)公司在陌生市場(chǎng)進(jìn)行用戶獲取和品牌建設(shè)的巨大不確定性。
4、硬件生態(tài)的減法:小米的手機(jī)、平板等設(shè)備,通過(guò)在端側(cè)集成Gemini Nano,云端結(jié)合Vertex AI,為海外用戶帶來(lái)了更智能的AI問(wèn)答和內(nèi)容生成體驗(yàn)。這減去的是硬件廠商在不同市場(chǎng)進(jìn)行軟件生態(tài)適配的繁重工作。
這些案例共同指向一個(gè)邏輯:Google正在將其在大模型、Cloud、Android、應(yīng)用分發(fā)(Google Play)等方面的全球優(yōu)勢(shì),打包成一套標(biāo)準(zhǔn)化的“出海服務(wù)”,讓中國(guó)開(kāi)發(fā)者可以像調(diào)用API一樣,輕松地調(diào)用這些能力,從而將精力聚焦于產(chǎn)品本身的核心競(jìng)爭(zhēng)力。
正因如此,中國(guó)開(kāi)發(fā)者借助Google的生態(tài)和全棧AI解決方案,在海外煥發(fā)活力。Google Play年度最佳榜單顯示,12家中國(guó)開(kāi)發(fā)者團(tuán)隊(duì)的13款應(yīng)用和游戲,在全球不同市場(chǎng)斬獲了14項(xiàng)“年度最佳應(yīng)用”大獎(jiǎng),彰顯了中國(guó)出海開(kāi)發(fā)者的卓越表現(xiàn)。
在展區(qū)現(xiàn)場(chǎng),還有一個(gè)有意思的Demo體驗(yàn)叫做“APP熱線”,只要給AI打個(gè)電話,AI 就能幫你生成一款A(yù)PP。整個(gè)過(guò)程大概用了5分鐘,AI最終根據(jù)你的想法,生成了四個(gè)內(nèi)容:原型、App界面、框架、編程代碼,很詳細(xì),開(kāi)發(fā)者甚至可以直接用起來(lái)。
我在Google I/O Connect China現(xiàn)場(chǎng)體驗(yàn)“APP熱線”
第三重減法:消除知識(shí)鴻溝
技術(shù)的快速迭代,往往會(huì)帶來(lái)新的“知識(shí)鴻溝”。開(kāi)發(fā)者需要不斷學(xué)習(xí),才能跟上時(shí)代的步伐。Google的第三重減法,是致力于消除這種鴻溝,為開(kāi)發(fā)者構(gòu)建一個(gè)從學(xué)習(xí)、分享到創(chuàng)業(yè)孵化的完整成長(zhǎng)路徑,減去他們“自我摸索”的迷茫。
這背后是一個(gè)由“人”構(gòu)成的、充滿活力的生態(tài)系統(tǒng):
1、系統(tǒng)化的學(xué)習(xí)路徑:Google在中國(guó)正式推出“Google開(kāi)發(fā)者計(jì)劃”(GDP,Google Developer Program),為開(kāi)發(fā)者提供了個(gè)性化的主頁(yè)、技能認(rèn)證和活動(dòng)匹配,旨在構(gòu)建一個(gè)官方的、緊密的開(kāi)發(fā)者社群。
2、遍布全國(guó)的社區(qū)網(wǎng)絡(luò):Google開(kāi)發(fā)者社區(qū)(GDG,Google Developer Groups)在中國(guó)已經(jīng)遍地開(kāi)花,它由開(kāi)發(fā)者自發(fā)運(yùn)營(yíng)、為開(kāi)發(fā)者服務(wù)。在這里,開(kāi)發(fā)者可以找到志同道合的同伴,共同學(xué)習(xí)和實(shí)踐最新的技術(shù)。
3、專家引領(lǐng):Google開(kāi)發(fā)者專家(GDE,Google Developer Experts)項(xiàng)目,匯聚了一批在Google各個(gè)技術(shù)領(lǐng)域?qū)I(yè)且經(jīng)驗(yàn)豐富的導(dǎo)師。他們通過(guò)演講、教程和開(kāi)源貢獻(xiàn),引領(lǐng)著整個(gè)生態(tài)系統(tǒng)的技術(shù)方向。
4、從創(chuàng)意到商業(yè)的孵化:對(duì)于有志于創(chuàng)業(yè)的開(kāi)發(fā)者,“Google出海創(chuàng)業(yè)加速器”計(jì)劃(GFSA,Google for Startups Accelerator)供了從產(chǎn)品構(gòu)建、市場(chǎng)推廣到業(yè)務(wù)擴(kuò)展的全方位支持,幫助他們將一個(gè)好的創(chuàng)意,真正變成一家能走向全球的公司。目前,第四屆“Google出海創(chuàng)業(yè)加速器”計(jì)劃正式開(kāi)放申請(qǐng)。
更可貴的是,這種“化繁為簡(jiǎn)”充滿了人文關(guān)懷。陳俊廷舉例說(shuō),Google于三年前啟動(dòng)的gReach項(xiàng)目,通過(guò)在職培訓(xùn)為殘障人士打造無(wú)障礙職業(yè)舞臺(tái),如今已幫助超過(guò)40位殘障學(xué)員開(kāi)啟開(kāi)發(fā)者職業(yè)生涯;Google還攜手新興教育基金會(huì),將技術(shù)與熱情帶到資源匱乏地區(qū),為中國(guó)欠發(fā)達(dá)地區(qū)1500多名女性學(xué)生提供開(kāi)源AI入門教育;自2022年起,Google 數(shù)字人才培養(yǎng)計(jì)劃已為全國(guó)210多所高校的800余名教師提供出海營(yíng)銷數(shù)字技能培訓(xùn),覆蓋超過(guò)6萬(wàn)名在校學(xué)生。Google正在確保,在這場(chǎng)AI浪潮中,沒(méi)有人因?yàn)榧寄懿蛔恪⒊錾肀尘?、身體條件而被落下。
第四重減法:讓創(chuàng)造回歸本質(zhì)
有了強(qiáng)大的模型,和開(kāi)放的生態(tài),如何讓開(kāi)發(fā)過(guò)程本身變得更智能、更高效?我們從現(xiàn)場(chǎng)看到,Google正在將AI深度集成到了AI、Android、Web、Cloud開(kāi)發(fā)的全流程中,這里單舉幾個(gè)例子:
一個(gè)是支持離線開(kāi)發(fā)。Google開(kāi)發(fā)技術(shù)推廣工程師魏巍在現(xiàn)場(chǎng),用一臺(tái)完全離線的筆記本電腦,通過(guò)社區(qū)工具LM Studio,調(diào)用本地的Gemma 2模型,完成了圖片識(shí)別、信息提取、多語(yǔ)言上下文理解與更新等任務(wù)。
此外最受關(guān)注的更新是智能體模式(Agent Mode),這幾乎是一種“無(wú)代碼”的開(kāi)發(fā)體驗(yàn)。其中,F(xiàn)irebase Studio中的“自主智能體模式”(Autonomous Agent Mode),能讓Gemini獨(dú)立處理多種任務(wù),包括創(chuàng)建原型、添加功能、修復(fù)Bug、重構(gòu)組件等;Android Studio的“智能體模式”(Agent Mode),讓開(kāi)發(fā)者可以用自然語(yǔ)言下達(dá)復(fù)雜指令,比如“修復(fù)這個(gè)UI布局問(wèn)題”或“重構(gòu)這個(gè)組件”等,智能體會(huì)自動(dòng)規(guī)劃并執(zhí)行跨文件的代碼修改。而且,為了進(jìn)一步擴(kuò)展Agent Mode的能力,Google增加了對(duì)MCP(模型上下文協(xié)議)的支持,允許Agent Mode與外部工具交互。這標(biāo)志著開(kāi)發(fā)將從“寫代碼”向“指揮代碼”的轉(zhuǎn)變。
更具突破性的是,Android Studio現(xiàn)在支持“自帶模型”(Bring Your Own Model),允許開(kāi)發(fā)者在IDE(集成開(kāi)發(fā)環(huán)境)中,直接調(diào)用本地運(yùn)行的Gemma模型,或符合企業(yè)策略的模型。現(xiàn)場(chǎng)演示中,開(kāi)發(fā)者在斷網(wǎng)環(huán)境下,通過(guò)本地Gemma模型,解決了UI布局問(wèn)題,并用中文獲得了代碼建議。這標(biāo)志著AI輔助開(kāi)發(fā)進(jìn)入了一個(gè)兼顧離線、隱私與定制化的新階段。
在Android開(kāi)發(fā)上,Google還推出了一些新功能,例如實(shí)時(shí)更新(Live Updates),這是一個(gè)全新的通知功能,旨在幫助用戶專注于時(shí)間敏感的任務(wù),如航班、外賣和網(wǎng)購(gòu)訂單。目前,Google正與小米、OPPO、一加、vivo、iQOO等終端廠商,以及攜程、Runtastic、餓了么等應(yīng)用開(kāi)發(fā)者合作,為他們的海外客戶提供實(shí)時(shí)更新的通知體驗(yàn)。
可見(jiàn),Google正在編織一張無(wú)處不在的AI協(xié)作網(wǎng)絡(luò),其最終目的,是解放開(kāi)發(fā)者的生產(chǎn)力,讓他們能將更多精力投入到真正的“創(chuàng)造”而非重復(fù)的“勞動(dòng)”中。
回到密斯·凡·德羅的“少即是多”。當(dāng)Google用AI為開(kāi)發(fā)者減去了重復(fù)的編碼、用全球化平臺(tái)減去了出海的壁壘、用完善的生態(tài)減去了開(kāi)發(fā)的繁瑣,開(kāi)發(fā)者被解放的,不僅是生產(chǎn)力,更是創(chuàng)造力。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。