曾幾何時,在孩子們的童年還沒有被各類智能手機和電腦游戲所占領(lǐng)的年代,父母和長輩們會不時興致勃勃地把尚且年幼的孩子叫到跟前,出一些字謎讓他們猜,而后饒有興致地分享各類字謎的解法。隨著時代的車輪不斷向前,猜字謎這項有趣的中國傳統(tǒng)民間文化逐漸消失在了人們的視野中?,F(xiàn)在,我們很難有機會在除了元宵節(jié)之外的日子體驗猜字謎游戲的樂趣。即便能夠體驗,現(xiàn)代的青年人恐怕在面對各類字謎時,也會顯得無從下手吧。
元宵節(jié)當天,微軟亞洲研究院在已有的微軟對聯(lián)平臺上推出了一個新功能——微軟猜字謎。當用戶輸入謎面后,系統(tǒng)自動分析謎面,而后迅速給出謎底。更有趣的是,這款系統(tǒng)還可以為用戶自動生成謎面。當用戶輸入謎底(單個字)后,系統(tǒng)可自動生成若干謎面供用戶選擇。
字謎是中國文化獨有的內(nèi)容,是以一個或幾個漢字為謎底的謎語。這種謎語的編寫或是利用了漢字的造字規(guī)律,或是利用了漢字形、音、義某一方面的特點,既有趣味,又有知識內(nèi)涵。根據(jù)謎面的不同,字謎可分為:字形謎、字義謎、典故謎等多個類別。由于中國字義謎和典故謎的構(gòu)成更為復(fù)雜,此次微軟亞洲研究院推出的計算機自動猜字謎系統(tǒng)主要針對的是字形謎,即謎面是根據(jù)謎底(一個字)的字形而設(shè)計的。
這款字謎系統(tǒng)由微軟亞洲研究院自然語言計算組開發(fā),耗時四個月。開發(fā)這樣一個系統(tǒng),研究人員需要首先進行大量的數(shù)據(jù)挖掘工作,并從收集到的大量字謎中挑選出字形謎。而后建模,用統(tǒng)計機器學習的方法對模型進行訓練,得到一個能將各類自然語言描述轉(zhuǎn)化為特定偏旁部首的優(yōu)化模型。最后,將得出的各類偏旁部首映射到有可能的字,即謎底。在這款字謎系統(tǒng)的頁面中,我們不僅在輸入字形謎的謎面后可以看到最佳答案,而且還可以看到推理的過程,這對于猜字謎的思維訓練是非常有幫助的。
自然語言計算組負責人,微軟亞洲研究院首席研究員周明是機器翻譯和自然語言處理等領(lǐng)域的專家,曾主導了微軟對聯(lián)系統(tǒng)的開發(fā)。他表示:”猜字謎是在微軟對聯(lián)系統(tǒng)之后,我們對人工智能的又一個有意義的嘗試。這些創(chuàng)新集中體現(xiàn)了NLP 2.0的戰(zhàn)略思想,即對基于互聯(lián)網(wǎng)的平臺,對大數(shù)據(jù)進行搜集、利用統(tǒng)計機器學習方法自動學習建立智能模型、然后快速上線獲得用戶反饋從而把用戶引入到創(chuàng)新的過程之中。猜字謎系統(tǒng)的水平也會不斷提升“。
當然,推出這款基于字形謎的計算機自動猜字謎系統(tǒng)僅僅是個開始,微軟亞洲研究院的研究員們還將繼續(xù)深入研究,推出包括更多類型的字謎系統(tǒng),以及擴展到字謎之外的其他類型的謎語。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務(wù)上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。