“大模型時代,夸克有巨大機會創(chuàng)造出革新性搜索產(chǎn)品。”11月22日,夸克大模型公布了其面向搜索、生產(chǎn)力工具和資產(chǎn)管理助手的大模型技術(shù)布局。數(shù)據(jù)顯示,夸克千億級參數(shù)大模型登頂C-Eval和CMMLU兩大權(quán)威榜單,夸克百億級參數(shù)大模型同樣在法律、醫(yī)療、問答等領(lǐng)域的性能評測中奪冠。

憑借在搜索業(yè)務(wù)和智能技術(shù)上的長期積累,夸克大模型利用數(shù)據(jù)、平臺、知識增強等優(yōu)勢,可以大幅提升知識正確性。在醫(yī)療健康領(lǐng)域,夸克大模型已經(jīng)可以將問答內(nèi)容的幻覺率降低至5%,處在行業(yè)領(lǐng)先水平。
夸克推進搜索革新,自研大模型打造技術(shù)新底座
在互聯(lián)網(wǎng)高速發(fā)展的30余年中,搜索曾經(jīng)高效地滿足了用戶主動獲取信息的需求。但是隨著移動互聯(lián)網(wǎng)內(nèi)容生產(chǎn)和供給模式的轉(zhuǎn)變,傳統(tǒng)搜索逐步變得封閉化、孤島化?;诖竽P偷腁IGC技術(shù)將會給搜索產(chǎn)品帶來全新變化,推進搜索革新已經(jīng)成為行業(yè)共識。
夸克技術(shù)負責人蔣冠軍表示,夸克大模型是面向搜索、生產(chǎn)力工具和資產(chǎn)管理助手的應(yīng)用型大模型。在搜索應(yīng)用中,將通過圖文多模理解、專業(yè)知識生成、交互方式創(chuàng)新進一步拓寬應(yīng)用場景,提升用戶體驗。

夸克技術(shù)負責人蔣冠軍
夸克大模型的優(yōu)勢源自于智能技術(shù)實力與搜索業(yè)務(wù)基礎(chǔ),蔣冠軍認為,夸克大模型有四大優(yōu)勢:第一、最全面的通用知識數(shù)據(jù)和行業(yè)知識數(shù)據(jù),以及知識理解和評估體系;第二、得益于搜索技術(shù)體系的積累,擁有千億級參數(shù)平臺的模型訓(xùn)練能力;第三、擁有長期智能化產(chǎn)品經(jīng)驗的智能技術(shù)產(chǎn)運團隊。第四、擁有全行業(yè)的知識增強技術(shù)體系及能力。
面向未來,要解決大模型的應(yīng)用問題,關(guān)鍵要解決知識正確性問題。據(jù)悉,基于強大的搜索產(chǎn)品和智能技術(shù)積累,夸克大模型在知識增強上的優(yōu)勢可以大幅提升知識正確性。同時,在醫(yī)療健康領(lǐng)域,夸克已經(jīng)可以將問答內(nèi)容的幻覺率降低至5%,處在行業(yè)領(lǐng)先水平??淇舜竽P鸵矊⑹浅掷m(xù)推動夸克App產(chǎn)品體驗創(chuàng)新和邁向新一代搜索的技術(shù)底座。
夸克大模型性能評測奪冠 四大能力提升用戶效率
日前,阿里巴巴智能信息事業(yè)群發(fā)布全棧自研、千億級參數(shù)的夸克大模型,將應(yīng)用于通用搜索、醫(yī)療健康、教育學習、職場辦公等眾多場景??淇舜竽P偷恼w水平超越GPT-3.5,在多語言翻譯、寫代碼、安全合規(guī)、內(nèi)容創(chuàng)作等方面處在國內(nèi)行業(yè)頭部水平。
針對AIGC技術(shù)與搜索產(chǎn)品在大模型領(lǐng)域的協(xié)同發(fā)展,清華大學新聞學院教授、博士生導(dǎo)師沈陽認為,依托搜索平臺,夸克大模型擁有高質(zhì)量的各類數(shù)據(jù),在中文語境下,模型能力處在行業(yè)領(lǐng)先水平。在教育、醫(yī)療等垂直領(lǐng)域中,夸克在對話、解題上的能力取得了新的突破,是國產(chǎn)自研大模型的優(yōu)秀代表之一。同時,在安全性能上,夸克經(jīng)歷了搜索場景下的長時間考驗,累積了非常豐富的經(jīng)驗和能力。
數(shù)據(jù)顯示,夸克大模型接連登頂C-Eval和CMMLU兩大權(quán)威評測榜單,多項性能優(yōu)于GPT-4。在國內(nèi)大模型賽道火熱的當下,夸克大模型具備較好的語義理解、知識掌握與應(yīng)用、邏輯推理能力,整體水平達到行業(yè)一流水平。
另外,在最新的百億參數(shù)測試集中,夸克同樣在法律、醫(yī)療、問答等多個領(lǐng)域中排名第一,夸克大模型在不同參數(shù)量級的對比中均表現(xiàn)優(yōu)秀。
在大模型技術(shù)落地層面,夸克大模型的能力體現(xiàn)在四個方面,可以幫助用戶提升工作、學習效率。知識能力,擁有廣泛的知識覆蓋、信息搜集和多語言支持等,支持外接專業(yè)知識增強,提升跨領(lǐng)域的知識和語言理解能力;對話能力,具備較強的上下文理解、語境推理、關(guān)鍵信息保持和記憶能力,更好地適應(yīng)不斷變化的語境,理解用戶的意圖和需求,確保對話回復(fù)準確、合理、連貫;創(chuàng)作能力,能夠根據(jù)主題或關(guān)鍵詞,生成連貫、有邏輯、有深度的文本內(nèi)容,支持續(xù)寫、潤色、仿寫、批改等多種不同寫作需求;安全能力,具備較好的世界觀、價值觀,對于明顯的虛假信息,均能做到準確識別、正確回答或者給出合理指引。
以用戶需求出發(fā),打造工作、學習、生活的AI助手,夸克App持續(xù)迭代進化。據(jù)悉,夸克大模型將全面升級夸克在搜、用、存上的智能化體驗,幫助用戶進一步提升效率。同時,基于多年累積的搜索優(yōu)勢,夸克將借助AI驅(qū)動推進搜索革新,加速邁向下一代搜索。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務(wù)上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。