華大在線訊(通訊員 萬仟)近日,人工智能教育學(xué)部劉三女牙教授團(tuán)隊(duì)在教育大模型研究方向取得重要進(jìn)展,創(chuàng)新性提出基于經(jīng)典教育學(xué)理論“經(jīng)驗(yàn)之塔”的教育大模型塔式構(gòu)建法,在此基礎(chǔ)上設(shè)計(jì)了多智能體自主驅(qū)動(dòng)的教學(xué)場景數(shù)據(jù)合成框架,為促進(jìn)教育大模型創(chuàng)新發(fā)展提供了一種新穎且有效的技術(shù)途徑。此外,研究團(tuán)隊(duì)成功獲批本年度國家自然科學(xué)基金重點(diǎn)項(xiàng)目“面向智慧教育的多模態(tài)模型構(gòu)建方法”。
研究成果“COMET: ‘Cone of Experience’ Enhanced Large Multimodal Model for Mathematical Problem Generation”在《中國科學(xué):信息科學(xué)》英文版《SCIENCE CHINA Information Sciences》在線發(fā)表。數(shù)學(xué)試題作為重要的知識(shí)載體與考核工具,其自動(dòng)生成技術(shù)在教學(xué)過程中具有重要的應(yīng)用價(jià)值。傳統(tǒng)出題與解題分離的研究路徑、單調(diào)的微調(diào)數(shù)據(jù)結(jié)構(gòu)以及單一的模型優(yōu)化目標(biāo),限制了數(shù)學(xué)試題生成模型在教學(xué)場景中的應(yīng)用。該成果從能力互促與應(yīng)用邏輯出發(fā),在一個(gè)大模型上整合了題干生成與題目解析兩種能力;提出了一種基于“經(jīng)驗(yàn)之塔”的三階段塔式構(gòu)建框架,以類人學(xué)習(xí)的視角探索大模型訓(xùn)練過程類比人類學(xué)習(xí)經(jīng)歷的有效性,通過剖析優(yōu)秀人類教師的成長歷程,將微調(diào)數(shù)據(jù)按照抽象、觀察和實(shí)踐三個(gè)層次的經(jīng)驗(yàn)內(nèi)涵分別構(gòu)造,并設(shè)計(jì)多種精細(xì)化的數(shù)據(jù)形式與注入方法;構(gòu)建了一個(gè)中文多模態(tài)數(shù)學(xué)試題數(shù)據(jù)集CMM12K,為后續(xù)研究提供測評(píng)基準(zhǔn)。在三個(gè)數(shù)據(jù)集上執(zhí)行10個(gè)模型參與的高達(dá)15個(gè)測試維度的性能對(duì)比:相比開源大模型,所提方法在12個(gè)測試維度上達(dá)到了當(dāng)前領(lǐng)域最佳水平。
研究成果“VCR: A ‘Cone of Experience’ Driven Synthetic Data Generation Framework for Mathematical Reasoning”被人工智能國際頂級(jí)會(huì)議AAAI《The 39th Annual AAAI Conference on Artificial Intelligence》正式接收錄用。大語言模型在自然語言處理方面性能出色,但面對(duì)數(shù)學(xué)推理往往存在較大挑戰(zhàn)。隨著訓(xùn)練模式的逐漸固化,學(xué)術(shù)界提出以數(shù)據(jù)為中心的人工智能思想,強(qiáng)調(diào)開發(fā)更高質(zhì)量的數(shù)據(jù)以增強(qiáng)大語言模型性能。現(xiàn)有研究擴(kuò)展數(shù)據(jù)集構(gòu)建面向數(shù)學(xué)推理的合成數(shù)據(jù),進(jìn)而監(jiān)督微調(diào)大語言模型。這類方法大多關(guān)注數(shù)量而忽視質(zhì)量,具有挑戰(zhàn)性的樣本在數(shù)據(jù)合成過程中沒有得到充分的考慮,導(dǎo)致數(shù)據(jù)構(gòu)建成本高、密度低、同質(zhì)化嚴(yán)重。該成果提出了一種名為Virtual ClassRoom(VCR)的多智能體環(huán)境,利用大語言模型驅(qū)動(dòng)多種智能體角色構(gòu)建高質(zhì)量、多元化的合成數(shù)據(jù)。基于“經(jīng)驗(yàn)之塔”理論,VCR類比人類學(xué)習(xí),在數(shù)據(jù)合成過程中引入三個(gè)層次的經(jīng)驗(yàn),精心設(shè)計(jì)了用戶友好的指令集和角色扮演系統(tǒng),使VCR能夠自主規(guī)劃合成數(shù)據(jù)的規(guī)模。該系統(tǒng)實(shí)現(xiàn)了包括講授、研討、問題設(shè)計(jì)、問題解決等多種教育場景的自主模擬。多個(gè)實(shí)驗(yàn)表明VCR生成的合成數(shù)據(jù)具有更高的質(zhì)量密度和泛化能力,能夠以較小的訓(xùn)練代價(jià)提高大語言模型的數(shù)學(xué)推理性能。
近年來,劉三女牙教授帶領(lǐng)研究團(tuán)隊(duì)立足“人工智能+教育”國家戰(zhàn)略需求和學(xué)術(shù)前沿,系統(tǒng)化開展教育可計(jì)算理論、方法與應(yīng)用創(chuàng)新研究,在教育研究、Nature Computational Science、C&E、ACM/IEEE Trans,以及AAAI、ACM MM、AIED、WWW等教育科學(xué)、信息科學(xué)領(lǐng)域的頂刊頂會(huì)發(fā)表了一系列成果,發(fā)展了AI4EduSci教育科學(xué)智能新范式、計(jì)算教育學(xué)新方向以及教育大模型構(gòu)建新方法,服務(wù)于中國特色教育科學(xué)知識(shí)體系建構(gòu)與教育強(qiáng)國建設(shè)。
SCIENCE CHINA Information Sciences是由中國科學(xué)院和國家自然科學(xué)基金委員會(huì)共同主辦的期刊,致力于發(fā)表在計(jì)算機(jī)科學(xué)與技術(shù)、控制科學(xué)與工程、信息與通信工程、微電子與固體電子、量子信息等信息科學(xué)領(lǐng)域的高質(zhì)量、原創(chuàng)成果。該刊是SCI JCR Q1期刊,也是中國計(jì)算機(jī)學(xué)會(huì)CCF推薦A類期刊。
AAAI是人工智能促進(jìn)協(xié)會(huì)主辦的國際頂級(jí)人工智能學(xué)術(shù)會(huì)議,旨在推動(dòng)人工智能科學(xué)研究,促進(jìn)人工智能領(lǐng)域研究人員、從業(yè)者、科學(xué)家、學(xué)生和工程師之間的學(xué)術(shù)交流,主題包括機(jī)器學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺、數(shù)據(jù)挖掘、多智能體系統(tǒng)、知識(shí)表示和人在回路人工智能等。AAAI是中國計(jì)算機(jī)學(xué)會(huì)CCF推薦A類會(huì)議。
劉三女牙教授為SCIENCE CHINA Information Sciences與AAAI兩篇論文成果的第一作者,萬仟博士后、沈筱譞博士后與孫建文教授為論文共同通訊作者,華中師范大學(xué)為SCIENCE CHINA Information Sciences論文成果的第一完成單位,以及AAAI論文成果的唯一完成單位。浙江大學(xué)為SCIENCE CHINA Information Sciences論文成果的合作完成單位,羅亞威研究員參與該論文的合作研究。研究獲得了國家自然科學(xué)基金重點(diǎn)項(xiàng)目“面向智慧教育的多模態(tài)模型構(gòu)建方法”、國家自然科學(xué)基金重大項(xiàng)目“人工智能賦能教與學(xué)的理論與關(guān)鍵技術(shù)研究”、新一代人工智能國家科技重大專項(xiàng)項(xiàng)目“面向智慧教育的學(xué)習(xí)者認(rèn)知與情感計(jì)算研究”等資助。
相關(guān)鏈接:
https://engine.scichina.com/doi/10.1007/s11432-024-4242-0
https://mp.weixin.qq.com/s/vtpeGydR9Nr8gL2-ycrlkw
(審讀人:左明章)