在前不久舉行的第十五屆全國(guó)周培源大學(xué)生力學(xué)競(jìng)賽(個(gè)人賽)中,北京市有一名特殊的“考生”。
為了這名“考生”,主辦方特意在中國(guó)礦業(yè)大學(xué)(北京)設(shè)置“AI答題考場(chǎng)”,并拉起紅色橫幅??紙?chǎng)內(nèi)有一臺(tái)電腦、三名學(xué)生和一位監(jiān)考老師。在答題過(guò)程中,還不時(shí)地有人來(lái)這里觀(guān)看他們答題。
這三名學(xué)生并非考生——他們負(fù)責(zé)把答案謄抄到紙質(zhì)試卷上,真正的“考生”置于那臺(tái)電腦中。這位“AI考生”是由清華大學(xué)航天航空學(xué)院項(xiàng)目團(tuán)隊(duì)自主研發(fā)的人工智能力學(xué)求解系統(tǒng)——“GT-Mech”。
在這一國(guó)內(nèi)頂級(jí)的力學(xué)賽事中,“GT-Mech”與來(lái)自全國(guó)500多所高校的30591名人類(lèi)考生同時(shí)、同卷、同場(chǎng)進(jìn)行同臺(tái)競(jìng)技,最終成績(jī)達(dá)到此次賽事前五名的特等獎(jiǎng)水平。
“AI考生”如何獲得準(zhǔn)考證
“GT-Mech”團(tuán)隊(duì)核心成員、來(lái)自清華大學(xué)行健書(shū)院錢(qián)學(xué)森力學(xué)班的大四學(xué)生周懿介紹,清華大學(xué)航天航空學(xué)院多個(gè)課題組都關(guān)注著AI技術(shù)的發(fā)展,她也致力于探索AI在航天航空智能化方面的應(yīng)用。但航天航空是一個(gè)復(fù)雜的系統(tǒng)工程,周懿苦于尋找切實(shí)可行的落地路徑。
近幾年隨著生成式人工智能的迅速發(fā)展,不少高校師生開(kāi)始關(guān)注該技術(shù)如何應(yīng)用于科研和教育教學(xué)?!罢n題組的老師經(jīng)常與我們交流討論這些問(wèn)題,比如現(xiàn)存的通用大模型解決本科生遇到的最難的問(wèn)題,能達(dá)到什么程度?”這一提問(wèn)在清華大學(xué)航天航空學(xué)院碩士三年級(jí)學(xué)生李潤(rùn)道心中埋下了一顆種子。
巧合的是,來(lái)自同一學(xué)院航天動(dòng)力學(xué)與控制實(shí)驗(yàn)室的博二學(xué)生宋家隆上學(xué)期正好擔(dān)任理論力學(xué)這門(mén)課的助教。隨著今年年初DeepSeek的橫空出世,他嘗試使用市面上常見(jiàn)的大模型來(lái)解答理論力學(xué)的期末考試題,發(fā)現(xiàn)效果不盡如人意。
三人的困惑聚集重疊,又指向同一解法。清華大學(xué)助理教授程彬啟示他們可以研發(fā)一款專(zhuān)門(mén)求解力學(xué)難題的AI系統(tǒng)。
這時(shí),過(guò)完春節(jié)返校的他們,發(fā)現(xiàn)第十五屆全國(guó)周培源大學(xué)生力學(xué)競(jìng)賽正在報(bào)名階段。作為全國(guó)規(guī)模最大、影響力最大的頂尖力學(xué)賽事,“通常,物理學(xué)、航天航空等專(zhuān)業(yè)的本科生參賽,也難以取得高分,競(jìng)賽題目是非常難的。”宋家隆說(shuō)。
三人想研發(fā)出專(zhuān)門(mén)求解力學(xué)難題的AI系統(tǒng),并“真刀真槍”地上“戰(zhàn)場(chǎng)”。但競(jìng)賽通知中明確寫(xiě)著:參賽對(duì)象為“在校大學(xué)生及研究生”。
AI系統(tǒng)能參賽嗎?這一問(wèn)題擺在了項(xiàng)目團(tuán)隊(duì)的面前。
青年總是勇于嘗試。他們通過(guò)學(xué)校理論力學(xué)教研組聯(lián)系到賽事主辦方——中國(guó)力學(xué)學(xué)會(huì),向其表示“正在研發(fā)一款用AI求解力學(xué)問(wèn)題的系統(tǒng),想要參賽”的愿望。
令他們感到意外的是,中國(guó)力學(xué)學(xué)會(huì)非常支持。“他們表現(xiàn)出對(duì)AI如何啟發(fā)力學(xué)教育、力學(xué)發(fā)展的興趣,希望我們?nèi)ミM(jìn)行更多探索?!敝苘舱f(shuō)。中國(guó)力學(xué)學(xué)會(huì)給這名“AI考生”減免了120元的考試報(bào)名費(fèi)。
為保證競(jìng)賽的公平,中國(guó)力學(xué)學(xué)會(huì)回復(fù):作為一項(xiàng)新舉措,AI系統(tǒng)的參與僅作為技術(shù)展示環(huán)節(jié),目的在于探索AI技術(shù)在力學(xué)教育中的應(yīng)用,其答題成績(jī)不計(jì)入正式比賽評(píng)獎(jiǎng)。不影響排名,不會(huì)占用學(xué)生的評(píng)獎(jiǎng)名額。
從稚童到“超級(jí)學(xué)霸”,“AI考生”只用了兩個(gè)多月
獲得了“準(zhǔn)考證”,接下來(lái)就是研發(fā)環(huán)節(jié)了。此時(shí)距離5月舉行的個(gè)人賽,只有兩個(gè)多月的時(shí)間。
此前,三人分別嘗試用市面上現(xiàn)有的通用大模型來(lái)解答復(fù)雜的力學(xué)問(wèn)題,但是正確率不高,只給出分析思路,不具體計(jì)算求解?!耙?yàn)橥ㄓ么竽P偷臄?shù)據(jù)庫(kù)里,力學(xué)知識(shí)的占比應(yīng)該非常少,知識(shí)基礎(chǔ)薄弱,對(duì)于復(fù)雜的力學(xué)難題,AI難以讀懂題目的意思、理解具體的物理情景,所以是非常難做對(duì)題目的?!敝苘步忉?。
相比于人工智能在化學(xué)蛋白質(zhì)折疊、物理學(xué)機(jī)器學(xué)習(xí)等方面已獲得的成功,它在理論力學(xué)及復(fù)雜力學(xué)問(wèn)題上的探索,稚嫩得仿佛孩童。
三人聚在一起開(kāi)始了新的探索。最初,他們的想法還是不斷訓(xùn)練現(xiàn)有的生成式人工智能大模型,“團(tuán)隊(duì)為通用大模型補(bǔ)充了大量專(zhuān)業(yè)的力學(xué)知識(shí)資料和經(jīng)典習(xí)題,進(jìn)行專(zhuān)門(mén)的語(yǔ)料訓(xùn)練,收效依然甚微。”宋家隆說(shuō):“因?yàn)檫@些專(zhuān)業(yè)知識(shí)與通用大模型的語(yǔ)料庫(kù)相比,簡(jiǎn)直是杯水車(chē)薪?!?/p>
但是,AI解題很大程度上是概率問(wèn)題。李潤(rùn)道舉例:“理論力學(xué)的問(wèn)題與數(shù)學(xué)計(jì)算相似,但更復(fù)雜,需要理解題意、使用對(duì)應(yīng)知識(shí)點(diǎn),并將其按照邏輯順序正確地排列組合,才能推導(dǎo)出正確答案。”
“通用大模型的解題過(guò)程比較機(jī)械,不會(huì)根據(jù)條件的變化選擇合適的知識(shí)點(diǎn)去應(yīng)用,就像是不那么聰明的學(xué)生?!彼麄兩踔翆?duì)AI的能力產(chǎn)生了懷疑,有些氣餒。
該項(xiàng)目指導(dǎo)教師程彬適時(shí)提點(diǎn)了三人:“能不能讓AI像咱們本科生一樣,一步一步去思考解題呢?”
于是,他們嘗試把一道復(fù)雜的力學(xué)問(wèn)題,拆解成三五步甚至十幾個(gè)步驟,每個(gè)步驟對(duì)應(yīng)一個(gè)或幾個(gè)知識(shí)點(diǎn),將每個(gè)步驟分配給一個(gè)AI去解決,引入專(zhuān)門(mén)的“符號(hào)計(jì)算”引擎,并安排一個(gè)專(zhuān)門(mén)的AI來(lái)處理每步之間的排列組合和邏輯推導(dǎo)。
兩個(gè)多月里,他們測(cè)試了幾乎市面上所有的通用大模型,找出它們的“長(zhǎng)處”。宋家隆解釋?zhuān)骸拔覀儾⒉皇亲隽艘粋€(gè)大模型,而是集合多個(gè)大模型研制出了專(zhuān)門(mén)的系統(tǒng)?!?/p>
在此基礎(chǔ)上,他們還引入了檢查糾錯(cuò)機(jī)制?;卮鸾Y(jié)束后,系統(tǒng)自動(dòng)從單位量綱、物理直覺(jué)、邏輯嚴(yán)謹(jǐn)性等角度,對(duì)題目條件理解、知識(shí)點(diǎn)應(yīng)用、計(jì)算推導(dǎo)等環(huán)節(jié)進(jìn)行檢查糾錯(cuò),若“報(bào)錯(cuò)”就會(huì)自動(dòng)回溯修正。
經(jīng)過(guò)兩個(gè)多月的訓(xùn)練,“GT-Mech”系統(tǒng)像是集合了多位“學(xué)霸”所長(zhǎng)的一位“超級(jí)學(xué)霸”,能達(dá)到一位清華力學(xué)專(zhuān)業(yè)優(yōu)秀本科畢業(yè)生的解題水平。
“如果教與學(xué)都不改變,99%的學(xué)生都是AI的‘手下敗將’?”
清華大學(xué)行健書(shū)院院長(zhǎng)李俊峰得知項(xiàng)目團(tuán)隊(duì)的比賽成績(jī)后,在個(gè)人社交媒體中轉(zhuǎn)發(fā)信息時(shí)提出了一個(gè)問(wèn)題:從“基本不會(huì)”到“高分獲獎(jiǎng)”的過(guò)程很短。如果我們的教與學(xué)都不改變,99%的學(xué)生都是AI的“手下敗將”?我們要思考一下:在A(yíng)I時(shí)代,力學(xué)該怎么教、怎么學(xué)、怎么考核?
作為教師的程彬,也對(duì)AI的極速迭代發(fā)展、應(yīng)用于教學(xué)有所擔(dān)憂(yōu)。
因?yàn)槿说膶W(xué)習(xí)曲線(xiàn)是一個(gè)厚積薄發(fā)的過(guò)程,尤其理論力學(xué)這類(lèi)物理學(xué)基礎(chǔ)知識(shí),對(duì)于有志于科研的學(xué)生來(lái)說(shuō),更需打好扎實(shí)的基礎(chǔ)。“但是隨著今年年初DeepSeek火爆,我們發(fā)現(xiàn)很多同學(xué)十分依賴(lài)大模型的使用。甚至有數(shù)據(jù)監(jiān)測(cè)到,有同學(xué)半夜三四點(diǎn)還在和大模型對(duì)話(huà)。”程彬表示。
他進(jìn)一步坦言:“這一方面顯示了AI大模型陪伴性、即時(shí)應(yīng)答方面的優(yōu)勢(shì),但另一方面,對(duì)于剛?cè)雽W(xué)的學(xué)生,不理解AI技術(shù)邊界和缺陷,過(guò)度依賴(lài)、迷信AI反而會(huì)影響他們打好基礎(chǔ)和后續(xù)學(xué)習(xí)?!币虼?,“GT-Mech”目前還處于測(cè)試和小范圍試用階段。
“對(duì)于李俊峰教授的提問(wèn),我暫時(shí)也沒(méi)有答案,還在探索,這個(gè)問(wèn)題亟須每一位教師、社會(huì)各界共同思考?!背瘫蛘f(shuō)。
相比于師長(zhǎng)們的憂(yōu)慮較多,年輕人更加樂(lè)觀(guān)、充滿(mǎn)期待?!癆I還不夠智能,不正說(shuō)明你們的所學(xué)和工作不會(huì)被AI取代、有意義嗎?”面對(duì)這一提問(wèn),三人的回答十分相似。
周懿表示:“我的目的是探索AI應(yīng)用于航天航空智能化,從我的視角,我希望AI是一個(gè)輔助人類(lèi)的工具,希望它能盡可能‘好用’。但當(dāng)時(shí)我覺(jué)得它離‘好用’的標(biāo)準(zhǔn)有很遠(yuǎn)的距離,還應(yīng)該不斷地去訓(xùn)練它,讓它能更好地輔助我。”
李潤(rùn)道認(rèn)為:“從蒸汽時(shí)代、電氣時(shí)代到信息時(shí)代,科學(xué)技術(shù)的發(fā)展解放了勞動(dòng)力,讓人類(lèi)社會(huì)的生產(chǎn)力得到極大提升?,F(xiàn)在,許多團(tuán)體都在朝著研究通用人工智能的方向努力,我更希望AI在一些專(zhuān)業(yè)領(lǐng)域的進(jìn)步,能夠?qū)θ祟?lèi)的腦力勞動(dòng)進(jìn)行解放和生產(chǎn)力提升?!?/p>
宋家隆則談到他們“航天航空智能化”的目標(biāo):“如果AI有朝一日能夠從一些基礎(chǔ)的腦力勞動(dòng)開(kāi)始取代人類(lèi),讓他們專(zhuān)業(yè)地進(jìn)行更深層的思考和創(chuàng)造設(shè)計(jì),就能極大地方便科研人員?!?/p>
未來(lái),他們并不想讓“GT-Mech”止步于此。雖然“暫時(shí)不打算參加接下來(lái)舉行的第十五屆全國(guó)周培源大學(xué)生力學(xué)競(jìng)賽‘空間軌道設(shè)計(jì)’等團(tuán)體賽”,但是他們還是計(jì)劃將其不斷研發(fā)、迭代、“達(dá)到航天航空專(zhuān)業(yè)在讀博士生的水平”,讓它也有可能去參加一些航天航空類(lèi)競(jìng)賽。
這依然挑戰(zhàn)重重,但“可以期待一下”,周懿表示。
編輯:李華山