11月16日,根據(jù)最新成績,千億級參數(shù)的夸克大模型登頂C-Eval和CMMLU兩大權(quán)威評測榜單,多項性能優(yōu)于GPT-4。在國內(nèi)大模型賽道火熱的當(dāng)下,夸克自研大模型憑借過硬的研發(fā)能力及數(shù)據(jù)、行業(yè)、平臺等優(yōu)勢成為新晉“學(xué)霸”。
作為國內(nèi)最權(quán)威的兩個大語言模型測試榜單,C-Eval是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的綜合性考試評測集,覆蓋52個學(xué)科,是目前權(quán)威的中文AI大模型評測榜單之一。CMMLU 是由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出,包含67個主題,專門用于評估語言模型在中文語境下的知識和推理能力。
評測過程中,夸克大模型經(jīng)過了上萬道專業(yè)考題的檢驗,覆蓋幾十個學(xué)科和不同學(xué)段。無論是常識問題還是社會科學(xué)知識,夸克大模型都展現(xiàn)出了處理復(fù)雜、多層次問題的能力。基于精調(diào)后的訓(xùn)練數(shù)據(jù),夸克大模型能夠更好地理解問題的上下文、邏輯結(jié)構(gòu)和語義關(guān)系,從而更全面、深入地分析和解決問題。
在CMMLU榜單評測中,夸克大模型以平均77.08分的成績位列總成績第一,并占據(jù)社會科學(xué)和其他兩個類目的首位。在C-Eval榜單中,夸克大模型平均分達(dá)到89分,穩(wěn)居行業(yè)第一,同時在社會科學(xué)、人文科學(xué)和其他三個類目中位列榜首??淇舜竽P屯瑫r登頂兩大權(quán)威榜單,也進(jìn)一步證明夸克在數(shù)據(jù)增強(qiáng)、模型選擇、訓(xùn)練策略、模型融合以及模型評估上,處在行業(yè)領(lǐng)先地位。
同時,在國內(nèi)專業(yè)考試測試中,夸克大模型的表現(xiàn)堪稱“學(xué)霸”。不僅在中考、高考、研究生考試中超過GPT-4,包括臨床執(zhí)業(yè)醫(yī)師資格考試、計算機(jī)等級考試、公務(wù)員考試、教師資格證考試等評測中均優(yōu)于GPT-4。具備超強(qiáng)解題能力的夸克大模型,應(yīng)用在日常學(xué)習(xí)、工作場景,有望給用戶帶來效率上的全面提升。
此外,夸克大模型還擁有強(qiáng)大的文學(xué)創(chuàng)作能力,能夠根據(jù)用戶提供的主題或關(guān)鍵詞,生成連貫、有邏輯、有深度的文本內(nèi)容,可以幫助用戶撰寫文章、新聞、詩歌等各類文本,支持續(xù)寫、潤色、仿寫、批改等多種不同寫作需求,進(jìn)一步提高用戶的創(chuàng)作效率。
據(jù)介紹,憑借數(shù)據(jù)、行業(yè)、知識正確性、平臺等四大優(yōu)勢,夸克大模型應(yīng)用會優(yōu)先落地在通識問答、專業(yè)搜索等信息服務(wù)領(lǐng)域,滿足年輕人學(xué)習(xí)知識和提升自我的需求??淇藢⒔柚匝写竽P腿嫔?,為年輕人工作、學(xué)習(xí)、生活提供更全面的服務(wù)。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團(tuán)隊首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。