CNET科技資訊網(wǎng) 1月20日 北京消息(文/周雅):過去幾十年中,大數(shù)據(jù)改變了一個又一個領域。在氣象科學領域,借助大數(shù)據(jù),人們已經建立了更好的氣象模型,提前預報天氣;在高能物理領域,通過分析每秒4000萬次質子碰撞的數(shù)據(jù),人類可以尋找曾經難以捉摸的希格斯玻色子的證據(jù);在生命科學領域,通過大數(shù)據(jù),研究人員得以在超過30億核苷酸的人類基因組中,探究其中至少一個版本的全序列,從而展開個性化基因研究;電商領域更是離不開大數(shù)據(jù)......我們知道,大數(shù)據(jù)的應用有很多,現(xiàn)在在教育行業(yè),大數(shù)據(jù)應用也越來越多。
“正如越來越多的學生開始使用教育軟件和在線學習平臺,這些平臺獲取每一個學科、每一個學生的學習數(shù)據(jù)也變得越來越容易。”2017年1月10日,在論答公司(Learnta Inc.)于北京主辦的教育大數(shù)據(jù)研討會上,美國賓夕法尼亞大學(University of Pennsylvania)教育學院終身教授Ryan Baker指出。從Baker的分享中我們得知,教育數(shù)據(jù)挖掘至關重要,這些數(shù)據(jù)為教育平臺提供模型,這些模型讓學習系統(tǒng)從千人一面變成千人千面,從而改善目前的教育環(huán)境。具體情況,我們聽聽這個教授怎么說。
人類基因組測序
在美國,大量的學生每天都在使用Cognitive Tutor、ASSISTments、Reasoning Mind這樣的在線學習系統(tǒng)。比如,學生可以通過故事線索學數(shù)學,也可以在工作任務的情境中做語文題,甚至,孩子們一邊“打僵尸”一邊玩“數(shù)字游戲”:每個孩子都有很多武器,每件武器上都有自己的數(shù)字,如果要擊敗僵尸,武器上的數(shù)字必須整除僵尸胸口上的數(shù)字。
網(wǎng)絡教學(左下角:僵尸動作游戲Zombie Division)
Baker認為,這些個性化教育平臺至少要做到三件事:1、確定學生的有關數(shù)據(jù);2、了解對于學生的學習來說什么是真正重要的;3、有針對性地為學生提供合適的教學。
所有這些在線學習系統(tǒng)都會產生大量的數(shù)據(jù)流。當一個學生使用一個在線學習平臺時,他每小時會產生數(shù)以百計的行為,多個學生就產生了教育大數(shù)據(jù),比如在做出錯誤回答前可能會暫停和思考、尋求幫助、快速更改設置、從僵尸身邊跑開等,這些數(shù)據(jù)可以用于教育數(shù)據(jù)挖掘與分析。
這些教育數(shù)據(jù)挖掘有很多應用的方向,比如可以預測學生是否會輟學還是會成功完成學業(yè);或者能自動檢測學生的學習投入程度、情感、學習策略等,目的就是為了更好地實現(xiàn)個性化教學;甚至可以給老師、家長提供學習分析報告,進行教育科學的基礎研究。
現(xiàn)在,通過教育數(shù)據(jù)挖掘,很多研究團隊已經開發(fā)出了研究模型,這些模型可以推斷很多事情:
1、學生的元認知(meta-cognition,即學生對自己認知的認識)和求助行為。比如,這個學生有多自信?當他需要幫助時,有沒有在尋求幫助?他有沒有在給自己解釋問題,有沒有思考這個答案是正確的還是錯誤的?最重要的,當他面臨挑戰(zhàn)時,能否堅持下去?
2、有沒有投入學習、還是開始分心了。Baker舉了一個很有意思的親身經歷,看到有學生為了找正確答案而瞎蒙,在填空題里面填了“1”,發(fā)現(xiàn)不對,又改為填“2”,一直試到“38”這個數(shù)字,才找到正確答案。另外,有一些孩子會有非常難以解釋的行為,比如做數(shù)學題時不用方程的符號而是畫了一個笑臉。
3、學生情感。Baker 的研究團隊和其他研究團隊,已經創(chuàng)造了研究模型,可以根據(jù)數(shù)據(jù)推斷,學生是否感到厭倦、沮喪、困惑、好奇、興奮、快樂,是否投入,等等。
4、長期的學習結果。比如,學生能夠記住剛才他學的東西嗎?學生也沒有準備好學習下一個主題、下一個知識?這個中學生能上大學嗎?他會從大學畢業(yè)還是輟學?
學生的成績與結果數(shù)據(jù)表
并且,這些模型已經被大規(guī)模地應用于自適應學習系統(tǒng),為成千上萬的的學生所使用。
Baker列舉了全球七個大規(guī)模應用教育大數(shù)據(jù)分析模型的自適應學習系統(tǒng),包括:
1、Knewton,系統(tǒng)自動決定下一步該給學生推送什么樣的學習問題,已經在全球范圍實際應用于多個學科。
2、ALEKS,基于先行知識結構和知識點模型,為學生推薦學習內容,已經應用于美國高中與大學的數(shù)學和科學學科。
3、Cognitive Tutor,自動檢測學生的知識掌握情況,把握教學進度,直到學生最終掌握知識;同時,自動檢測學生的學習專注程度,為學校做出相關分析報告。已經應用于美國的初中和高中數(shù)學學科。
4、Learnta(論答自適應學習系統(tǒng)),基于先行知識結構和知識點模型,為學生推薦學習內容;同時,自動檢測學生的知識掌握情況,把握教學進度,直至最終掌握每一個知識點。根據(jù)中國學生的學習需求而本土化開發(fā),目前涵蓋數(shù)學和英語學科。
5、Reasoning Mind,自動檢測學生的學習專注度,為每個地區(qū)的教學管理員提供教師教學效果的報告,已經應用于美國的小學數(shù)學教育。
6、Duolingo(多鄰國),自動檢測學生的記憶,建議學生應當在什么時候復習之前學過的知識,已經在世界范圍內應用于外語詞匯的學習。
7、Civitas, Course Signals, Zogotech, 這些系統(tǒng)提供各種風險預測模型,給老師和學習顧問提供可具體實施和操作的學生信息,已經在世界范圍內的大學開始應用。
印度老師用手里的移動端采集學生的學習投入程度數(shù)據(jù)
Baker說,有足夠的實證研究證據(jù)證明,這七個學習系統(tǒng)中至少有以下兩個系統(tǒng)對于學生的學習是有顯著效果的:
其中一個是由胡祥恩教授在美國領導開展的多項實證研究項目,證明了ALEKS系統(tǒng)能夠有效提高各個不同族裔的美國學生的數(shù)學學習成績。
ALEKS系統(tǒng)
第二個是論答(Learnta)的自適應學習系統(tǒng)。Ryan Baker的研究團隊和論答公司合作,基于中國三個不同地區(qū)開展了三個實證研究項目,研究結果表明,學生通過論答自適應學習系統(tǒng)學習,比通過一個傳統(tǒng)的在線學習系統(tǒng)學習效果更好。
論答自適應學習系統(tǒng)
從長遠角度,Baker分析了這些教育大數(shù)據(jù)算法模型的潛在發(fā)展方向:
首先,通過學生知識和學習模型,來確定學生在什么時候需要更多支持,在學生掌握上一個知識之前,不會推薦該學生去學習下一個知識;而當學生需要支持的時候,系統(tǒng)會自動介入,并同時告訴該學生的老師和父母。
其次,通過學習投入程度模型,來檢測學生什么時候開始變得厭倦或者沮喪,并相應地調整學習任務,比如為那些厭倦的學生選擇一些更有趣的學習活動,為沮喪的學生選擇相對容易一些的學習任務。學習投入程度模型也可以用來確定為了讓學生更投入學習,需要什么樣的學習活動,最終甚至可以確定需要在什么時候提供、給什么樣的學生提供這些學習活動。
另外,還能告訴老師和父母,學生在什么時候開始在學習上變得分心。
最后,當一名學生沒有真正學會時,學習模型就可以檢測出來,并相應提供更多的練習,用不同的方法為學生提供解析,或者鼓勵學生自己去闡釋問題。
Baker最后總結道,這些不同的模型和方法現(xiàn)在都有很多應用的案例。教育人工智能(Artificial Intelligence in Education)、智能輔導系統(tǒng)(Intelligent Tutoring System)、教育數(shù)據(jù)挖掘(Educational Data Mining)、學習數(shù)據(jù)分析(Learning Analytics)等研究領域已經有大量有關這些模型和方法的研究文獻。下一步的目標應當是在系統(tǒng)中不斷優(yōu)化現(xiàn)在已經成功應用的模型和方法,最大限度地造福于中國和全世界數(shù)十億的學生。
據(jù)悉,Baker是美國賓夕法尼亞大學(University of Pennsylvania)教育學院終身教授、學習數(shù)據(jù)分析研究中心(Penn Center for Learning Analytics)主任,國際教育數(shù)據(jù)挖掘協(xié)會(International Educational Data Mining Society)的創(chuàng)始人、《教育數(shù)據(jù)挖掘》雜志(Journal of Educational Data Mining)的主編。Baker教授在各類期刊和會議發(fā)表了260余篇學術論文,先后主持了美國科學基金會(National Science Foundation),蓋茨基金會(Gates Foundation)等研究基金的多項項目,累計獲得研究經費超過1600萬美元。Baker的研究實驗室同時與亞洲,南美洲,以及歐洲的大學和研究機構開展合作項目。Baker本人也在哥倫比亞大學教育學院(Teachers College, Columbia University)和愛丁堡大學同時擔任教職,并在Coursera 和 edX 慕課平臺上開設了“Big Data in Education”《教育大數(shù)據(jù)》課程,注冊學生來自100多個國家和地區(qū)。
本次活動的合辦方包括賓夕法尼亞大學學習分析學研究中心(Penn Center for Learning Analytics)、中國人民大學統(tǒng)計與大數(shù)據(jù)研究院、華中師范大學心理學院、Knewton公司、芥末堆。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質量與分類性能的強相關性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應性。團隊承諾開源全部代碼,推動技術普及應用。
伊利諾伊大學研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復雜爭議、智能檢索相關文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學和政治爭議提供更全面客觀的分析,已在生物醫(yī)學和國際關系領域驗證有效性。
清華大學研究團隊首次提出情感認知融合網(wǎng)絡(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構,在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領域帶來革命性應用前景。
哈佛大學研究團隊通過創(chuàng)新的多智能體強化學習方法,讓AI在戰(zhàn)略游戲中學會復雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領域的應用奠定基礎,展現(xiàn)了通過模擬人類學習過程培養(yǎng)真正智能AI的新路徑。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。