國產(chǎn)大模型陣營再添新銳選手。11月14日,阿里巴巴智能信息事業(yè)群發(fā)布全棧自研、千億級(jí)參數(shù)的夸克大模型,將應(yīng)用于通用搜索、醫(yī)療健康、教育學(xué)習(xí)、職場辦公等眾多場景。夸克App將借助自研大模型全面升級(jí),加速邁向年輕人工作、學(xué)習(xí)、生活的AI助手。
近期,在CMMLU權(quán)威大模型性能評(píng)測中,夸克大模型成績位列榜首。最新評(píng)測顯示,夸克大模型整體能力已經(jīng)超過GPT-3.5,在寫作、考試等部分場景中優(yōu)于GPT-4。
國產(chǎn)自研大模型中的“學(xué)霸”
夸克大模型是基于Transformer架構(gòu)、自主研發(fā)的多模態(tài)大模型,每天會(huì)對(duì)億級(jí)的圖文數(shù)據(jù)進(jìn)行訓(xùn)練和精調(diào),具有低成本、高響應(yīng)、綜合能力強(qiáng)等特點(diǎn)。同時(shí),夸克大模型還將衍生出通識(shí)、醫(yī)療、教育等垂類模型,可以提供AIGC、智能檢索的專業(yè)服務(wù)。
性能方面,憑借語義理解、邏輯推理、內(nèi)容生成等技術(shù)優(yōu)勢(shì),夸克大模型在CMMLU權(quán)威榜單的最新評(píng)測結(jié)果中,取得排名第一的優(yōu)異成績。在國內(nèi)專業(yè)考試測試中,夸克大模型高考成績接近滿分,并以486分的高水平通過臨床執(zhí)業(yè)醫(yī)師資格考試,是名副其實(shí)的“學(xué)霸”。
同時(shí),夸克大模型具備了對(duì)不良、虛假信息識(shí)別、回答和指引的出色能力。知識(shí)能力方面,夸克大模型擁有廣泛的知識(shí)覆蓋、上下文理解、創(chuàng)造性表達(dá)、信息搜集和整合、多語言支持等,同時(shí)具備外接專業(yè)知識(shí)增強(qiáng)、檢索增強(qiáng)能力,進(jìn)一步提升跨領(lǐng)域、時(shí)效性的知識(shí)和語言理解能力。此外,夸克大模型還具有撰寫各類文本的強(qiáng)大文學(xué)創(chuàng)作能力,以及準(zhǔn)確、合理、連貫的對(duì)話回復(fù)能力。
整體能力超過GPT-3.5,部分場景優(yōu)于GPT-4,夸克大模型能力“爆表”源于數(shù)據(jù)、行業(yè)、知識(shí)正確性、平臺(tái)等四方面優(yōu)勢(shì)。首先,夸克大模型擁有最全面的中文數(shù)據(jù)庫,能更好地理解、評(píng)估、提煉中文知識(shí)體系;第二,夸克自建及擁有各類題庫、知識(shí)點(diǎn)、醫(yī)療知識(shí)圖譜、書籍及出版物等資料,沉淀了非常豐富的數(shù)據(jù)及用戶場景;第三,在通用知識(shí)、寫作增強(qiáng)等方面,夸克建立了從內(nèi)容、搜索再到推理的一套可辨別知識(shí)真?zhèn)蔚募夹g(shù)體系。第四,夸克組建了數(shù)百人的研發(fā)團(tuán)隊(duì),在搜索、教育、醫(yī)療等垂直領(lǐng)域中進(jìn)行大模型的預(yù)訓(xùn)練與精調(diào)。
據(jù)介紹,堅(jiān)持自研大模型的研發(fā)路線是服務(wù)于夸克的業(yè)務(wù)戰(zhàn)略,也是持續(xù)推動(dòng)夸克App在產(chǎn)品體驗(yàn)創(chuàng)新和邁向新一代搜索的技術(shù)底座。
夸克將借助自研大模型全面升級(jí)
今年以來,人工智能技術(shù)已經(jīng)逐步融入到夸克App的產(chǎn)品迭代中。夸克掃描王能夠在復(fù)雜場景下模仿人類思維,更精準(zhǔn)地識(shí)別、分析和提取文字、公式及圖片,實(shí)現(xiàn)更完美的掃描效果??淇司W(wǎng)盤上線的AI自然語言搜索功能,僅通過模糊詞、形容詞等關(guān)鍵信息,就能快速找到照片、文檔等云端資料,進(jìn)一步提升搜索效率。
作為最受年輕人青睞的智能產(chǎn)品,夸克App為數(shù)千萬95后職場人和大學(xué)生提供了跨場景的智能效率工具。根據(jù)QuestMobile發(fā)布的《2023年輕人群智能效率應(yīng)用研究》報(bào)告顯示,夸克App在泛學(xué)生人群和新生代職場人群的用戶占比最高,年輕用戶使用時(shí)長位列行業(yè)第一。
據(jù)悉,夸克大模型將會(huì)優(yōu)先落地在通識(shí)問答、專業(yè)搜索等信息服務(wù)領(lǐng)域,滿足年輕人學(xué)習(xí)知識(shí)和提升自我的需求。未來,夸克大模型應(yīng)用于搜索、智能工具和資產(chǎn)管理助手等場景,一系列AI原生應(yīng)用將為年輕人工作、學(xué)習(xí)、生活提供更全面的服務(wù)。
今年9月,阿里集團(tuán)宣布了用戶為先、AI驅(qū)動(dòng)的兩大戰(zhàn)略重心,將加大對(duì)“技術(shù)驅(qū)動(dòng)的互聯(lián)網(wǎng)平臺(tái)業(yè)務(wù)”、“AI驅(qū)動(dòng)的科技業(yè)務(wù)”等業(yè)務(wù)的戰(zhàn)略性投入。近日舉辦的2023世界互聯(lián)網(wǎng)大會(huì)上,阿里巴巴集團(tuán)CEO吳泳銘預(yù)判,在可見的未來,會(huì)有更智能的下一代產(chǎn)品進(jìn)入人們的生活,AI助理會(huì)無處不在,成為每個(gè)人工作、生活、學(xué)習(xí)中的助手。
“AI時(shí)代已經(jīng)來臨,大模型應(yīng)用的全新體驗(yàn)臨界點(diǎn)近在咫尺。”阿里巴巴智能信息事業(yè)群總裁吳嘉表示,基于大模型的AIGC技術(shù)將會(huì)給搜索產(chǎn)品帶來全新變化,加速邁向下一代搜索??淇私柚匝写竽P蛯⑷嫔?jí),全新的夸克很快會(huì)和大家見面。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。