-
潘禺:今年有另一場(chǎng)更值得關(guān)注的數(shù)學(xué)競(jìng)賽
AI的數(shù)學(xué)能力
ChatGPT這樣的大語(yǔ)言模型在簡(jiǎn)單的算術(shù)計(jì)算上會(huì)犯錯(cuò),因?yàn)槟P筒⒉皇菑幕驹硗茖?dǎo)出答案,而是根據(jù)輸入猜測(cè)最可能的輸出,這種方法有時(shí)候并不奏效。GPT-4的研究人員測(cè)試了數(shù)百道國(guó)際數(shù)學(xué)奧林匹克(IMO)級(jí)別的問(wèn)題,成功率只有1%,只有一個(gè)被簡(jiǎn)化后的特定問(wèn)題答對(duì)了。大型語(yǔ)言模型在生成回答時(shí)依賴于訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模式,盡管訓(xùn)練數(shù)據(jù)集非常龐大,但它們可能不包含足夠的邏輯推理或數(shù)學(xué)證明的示例。
DeepMind的AlphaProof和AlphaGeometry 2這兩個(gè)更專門(mén)的系統(tǒng),這次的表現(xiàn)就好得多。
AlphaProof是用于形式化數(shù)學(xué)推理的系統(tǒng),結(jié)合了預(yù)訓(xùn)練的語(yǔ)言模型和AlphaZero強(qiáng)化學(xué)習(xí)算法,也就是之前自學(xué)掌握了國(guó)際象棋、將棋和圍棋的算法。它在Lean中訓(xùn)練自己證明數(shù)學(xué)陳述,并通過(guò)自動(dòng)將自然語(yǔ)言陳述翻譯成形式化的數(shù)學(xué)語(yǔ)言陳述,創(chuàng)建了一個(gè)不同難度的形式化問(wèn)題庫(kù)。AlphaProof通過(guò)在Lean中搜索可能的證明步驟來(lái)生成候選解決方案,然后證明或反駁它們。在IMO比賽前幾周內(nèi),它證明或反駁了數(shù)百萬(wàn)問(wèn)題進(jìn)行自我訓(xùn)練,涵蓋不同的難度和廣泛的數(shù)學(xué)領(lǐng)域。
AlphaGeometry是一個(gè)神經(jīng)符號(hào)系統(tǒng),由神經(jīng)語(yǔ)言模型和符號(hào)推導(dǎo)引擎組成,它們協(xié)同工作以查找復(fù)雜幾何定理的證明。一個(gè)系統(tǒng)提供快速、 “直觀 ”的想法,而另一個(gè)系統(tǒng)則提供更深思熟慮、更理性的決策。
語(yǔ)言模型擅長(zhǎng)識(shí)別數(shù)據(jù)中的一般模式和關(guān)系,可以快速預(yù)測(cè)可能有用的結(jié)構(gòu),但通常缺乏嚴(yán)格推理或解釋其決策的能力。符號(hào)推導(dǎo)引擎基于形式邏輯,并使用明確的規(guī)則來(lái)得出結(jié)論,但緩慢而不靈活。語(yǔ)言模型指導(dǎo)符號(hào)推導(dǎo)引擎尋找?guī)缀螁?wèn)題的可能解決方案,從無(wú)限的可能性中預(yù)測(cè)哪些像點(diǎn)、線或圓這樣的新幾何結(jié)構(gòu)最有用。如果未找到解決方案,語(yǔ)言模型將添加一個(gè)可能有用的結(jié)構(gòu),為符號(hào)引擎開(kāi)辟新的推導(dǎo)路徑。此循環(huán)一直持續(xù),直到找到解決方案。
這有點(diǎn)像諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡尼曼在《思考,快和慢》一書(shū)中提出的人類思維的兩種系統(tǒng),快速思考系統(tǒng)是一種快速、直覺(jué)式的思維方式,慢速思考系統(tǒng)是一種緩慢、邏輯性強(qiáng)、需要集中注意力的思維方式。
AlphaGeometry 2采用的符號(hào)引擎比上一代快兩個(gè)數(shù)量級(jí)。當(dāng)遇到新問(wèn)題時(shí),使用一種新的知識(shí)共享機(jī)制來(lái)實(shí)現(xiàn)不同搜索樹(shù)的高級(jí)組合,以解決更復(fù)雜的問(wèn)題。在今年的比賽之前,AlphaGeometry 2可以解決過(guò)去25年中83%的歷史IMO幾何問(wèn)題,而上一代為53%。在今年的IMO 2024中,AlphaGeometry 2在收到形式化后的問(wèn)題后,19秒內(nèi)解決了第4題(下圖,要求證明 ∠KIL 和 ∠XPY 之和等于 180°,AlphaGeometry 2 提議構(gòu)造 E,即 BI上的一個(gè)點(diǎn),使 ∠AEB = 90°)。
訓(xùn)練AlphaGeometry并不是依靠人工的示例,AlphaGeometry首先生成了10億個(gè)幾何對(duì)象的隨機(jī)圖形,并詳盡地推導(dǎo)出每個(gè)圖形中點(diǎn)和線之間的所有關(guān)系,找到每個(gè)圖形中包含的所有證明,然后逆向工作以找出需要哪些額外的幾何結(jié)構(gòu)(如果有)來(lái)得出這些證明。數(shù)據(jù)經(jīng)過(guò)過(guò)濾,排除相似示例,產(chǎn)生一個(gè)包含1億個(gè)不同難度獨(dú)特示例的最終訓(xùn)練數(shù)據(jù)集。有了這么多添加新幾何結(jié)構(gòu)而得到證明的例子,AlphaGeometry的語(yǔ)言模型,就能夠在遇到奧數(shù)幾何題時(shí),為添加新結(jié)構(gòu)提出很好的建議。
我們的教育做好準(zhǔn)備了嗎
教育對(duì)個(gè)人成長(zhǎng)、社會(huì)進(jìn)步和國(guó)家發(fā)展都至關(guān)重要,人工智能對(duì)教育的影響已經(jīng)來(lái)臨,過(guò)去的運(yùn)作模式和利益結(jié)構(gòu)早晚都將受到?jīng)_擊。但或許是因?yàn)榧扔懈窬值母畹俟蹋瑖?guó)內(nèi)對(duì)這方面的討論還不多,但只要想想,同樣長(zhǎng)期具備壟斷性的傳媒行業(yè)發(fā)生了多大變化,就很難忽視這種改變的前景。
人工智能已經(jīng)深刻改變了媒體,當(dāng)人們使用TikTok、抖音、今日頭條之類的應(yīng)用獲取信息時(shí),算法主導(dǎo)了內(nèi)容的個(gè)性化推薦和分發(fā)。這一結(jié)果對(duì)傳媒行業(yè)的影響非常明顯,報(bào)紙、電視臺(tái)等傳統(tǒng)壟斷機(jī)構(gòu)無(wú)法再占據(jù)流量最大的傳播渠道。
在教學(xué)上,AI同樣已經(jīng)做到了通過(guò)分析學(xué)生的學(xué)習(xí)進(jìn)度、錯(cuò)誤模式和知識(shí)漏洞,提供個(gè)性化的學(xué)習(xí)路徑和習(xí)題練習(xí)。
比如,Khan Academy就使用機(jī)器學(xué)習(xí)算法,根據(jù)學(xué)生的答題記錄提供個(gè)性化的題目推薦,使學(xué)習(xí)更具針對(duì)性。AI平臺(tái)ALEKS通過(guò)自動(dòng)化反饋機(jī)制幫助學(xué)生在練習(xí)中獲得即時(shí)指導(dǎo),并通過(guò)不同題型進(jìn)一步鞏固知識(shí)。在線平臺(tái)DreamBox Learning提供自適應(yīng)數(shù)學(xué)練習(xí)系統(tǒng),學(xué)生的進(jìn)度可以依據(jù)他們的實(shí)時(shí)表現(xiàn)進(jìn)行調(diào)整,確保學(xué)習(xí)曲線與能力相匹配。
而在解題和題庫(kù)方面,AI也已經(jīng)有了不少實(shí)際應(yīng)用。通過(guò)AI應(yīng)用Socratic,學(xué)生可以拍攝問(wèn)題,系統(tǒng)自動(dòng)識(shí)別問(wèn)題并提供相應(yīng)的解答提示及詳細(xì)的解題過(guò)程。Edmentum使用AI生成多樣化的習(xí)題和測(cè)驗(yàn),以幫助教師設(shè)計(jì)針對(duì)性的評(píng)估,節(jié)省教師設(shè)計(jì)練習(xí)題的時(shí)間。
如今,Google DeepMind在高難度的競(jìng)賽解題上取得突破,意味著對(duì)數(shù)學(xué)這樣最重要的基礎(chǔ)學(xué)科,通過(guò)AI的加持,使優(yōu)質(zhì)教育資源能充足提供,不再稀缺,技術(shù)上的障礙已經(jīng)基本掃清。
Google正在基于Gemini開(kāi)發(fā)一種自然語(yǔ)言推理系統(tǒng),這意味著將不需要依賴人類專家將數(shù)學(xué)問(wèn)題翻譯成形式化的語(yǔ)言進(jìn)行處理,能與其它AI系統(tǒng)順利集成。當(dāng)AI以自然語(yǔ)言解決數(shù)學(xué)問(wèn)題后,科教系統(tǒng)的面貌必將改變。
中國(guó)教育有三大夢(mèng)想,因材施教、教育公平和減負(fù)。
因材施教的障礙在于,沒(méi)有盡全力嘗試,許多人并不能認(rèn)知到自己該走哪條路,家長(zhǎng)也不愿接受孩子“是騾子還是馬”。選擇的迷霧加劇了賽道的狹窄,而AI能提供針對(duì)性的評(píng)估,有效改善個(gè)人天賦與才能的識(shí)別效率,幫助每個(gè)人更早更精準(zhǔn)地定位和把握自己的比較優(yōu)勢(shì)。無(wú)論是利用圖像識(shí)別技術(shù)的體育測(cè)評(píng),還是基于機(jī)器學(xué)習(xí)的數(shù)學(xué)評(píng)估,AI會(huì)公正地幫助你判斷自己。
AI的發(fā)展能否帶來(lái)社會(huì)公平,這歷來(lái)是一個(gè)有爭(zhēng)議的問(wèn)題。對(duì)于互聯(lián)網(wǎng)科技公司來(lái)說(shuō),用戶的增加意味著技術(shù)成本的攤薄。雖然話不能說(shuō)絕對(duì),但從過(guò)去的經(jīng)驗(yàn)看,AI提供的教育資源,與別的互聯(lián)網(wǎng)服務(wù)一樣,也很可能是往普及方向發(fā)展的。這意味著,除了帶來(lái)因材施教,AI將促進(jìn)教育公平。
在減負(fù)上,AI也能發(fā)揮巨大作用。就像計(jì)算器對(duì)數(shù)學(xué)考試的影響,導(dǎo)致部分價(jià)值不大的計(jì)算在教學(xué)和考試中被舍棄,而更專注于考察數(shù)學(xué)思維、概念的理解和運(yùn)用。AI的影響也有希望進(jìn)一步優(yōu)化教學(xué)和考試內(nèi)容,減輕中國(guó)學(xué)生在某些解題套路上依靠“題海戰(zhàn)術(shù)”達(dá)到“肌肉記憶”的內(nèi)卷性消耗。
關(guān)注數(shù)學(xué)的人可能都知道今年國(guó)內(nèi)的一些輿情。某競(jìng)賽初賽結(jié)果的爭(zhēng)議徹底出圈了,某數(shù)學(xué)大師領(lǐng)銜的某書(shū)院的爭(zhēng)議,則一直在小圈子內(nèi)流傳。但由于涉及到中國(guó)教育的金字塔結(jié)構(gòu)和招考錄取的指揮棒,后者對(duì)家長(zhǎng)和學(xué)生的影響面其實(shí)并不小。
如果把這兩件事放在一起看,這都說(shuō)明了數(shù)學(xué)競(jìng)賽的門(mén)檻很高,數(shù)學(xué)研究的門(mén)檻更高,這條道路只適合極少數(shù)的人。這背后牽涉的討論非常復(fù)雜,但這個(gè)結(jié)論大致不差。
為了挑選出這少數(shù)人,需要多數(shù)人的陪跑。這種陪跑不僅發(fā)生在基礎(chǔ)教育階段,很多數(shù)學(xué)競(jìng)賽的獲獎(jiǎng)?wù)撸谝虼吮荛_(kāi)高考,獲得了頂級(jí)學(xué)府的錄取后,最終也都沒(méi)有選擇從事數(shù)學(xué)研究的道路,這也是網(wǎng)上“IMO金牌與菲爾茲獎(jiǎng)”的老生常談了。偏偏數(shù)學(xué)又是如此重要,社會(huì)在一定程度上容忍了投機(jī)與內(nèi)卷的情況,而形成了鼓勵(lì)“天才少年”的風(fēng)氣。但對(duì)每一個(gè)個(gè)體來(lái)說(shuō),內(nèi)卷的代價(jià)要獨(dú)自承受,成長(zhǎng)選擇的容錯(cuò)率都是有限的,缺少退路的攀登難以長(zhǎng)久,“一將功成萬(wàn)骨枯”的情況傷害社會(huì)的總體利益,國(guó)家努力給教輔降溫,阻止家庭為爭(zhēng)奪教育資源而“升級(jí)軍備競(jìng)賽”,背后也有這樣的考量。
教育是強(qiáng)國(guó)之基,教育資源和住宅用地一樣,人為制造出稀缺性,也許能夠造成短期的產(chǎn)業(yè)繁榮,卻可能埋下看不見(jiàn)的長(zhǎng)久隱患,比如已經(jīng)被一再討論的原始創(chuàng)新不足問(wèn)題。考慮人口結(jié)構(gòu)的變化和高學(xué)歷人口的規(guī)模,和住房一樣,中國(guó)優(yōu)質(zhì)教育資源稀缺的時(shí)代終將過(guò)去。
目前,還很難說(shuō)AI提供的充盈教育資源與個(gè)性化輔導(dǎo),能不能動(dòng)搖中國(guó)教育的金字塔結(jié)構(gòu),也不清楚教育領(lǐng)域的“今日頭條”,這樣的規(guī)則破壞者和秩序顛覆者會(huì)在什么時(shí)候出現(xiàn)。但最新的AI技術(shù)進(jìn)展,一定會(huì)鼓勵(lì)創(chuàng)業(yè)者與投資者摩拳擦掌,技術(shù)將又一次走在從業(yè)者和政策制定者的前面。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 心智觀察所- 原標(biāo)題:今年有另一場(chǎng)更值得關(guān)注的數(shù)學(xué)競(jìng)賽 本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 李昊 
-
中國(guó)貨運(yùn)航天飛機(jī),來(lái)了
2024-10-30 07:26 航空航天 -
馬斯克擁抱特朗普的隱秘心境,藏在這部美劇中
2024-10-29 14:35 心智觀察所 -
神十九將帶果蠅上太空 小鼠:等我
2024-10-29 13:34 航空航天 -
我國(guó)首艘深遠(yuǎn)海多功能科學(xué)考察及文物考古船完成試航
2024-10-26 19:44 中國(guó)精造 -
“把大象裝進(jìn)冰箱”,鴻蒙為什么行?
2024-10-25 14:41 心智觀察所 -
我國(guó)科研人員揭示過(guò)敏反應(yīng)關(guān)鍵機(jī)制
2024-10-25 13:40 -
我國(guó)成功發(fā)射天平三號(hào)衛(wèi)星
2024-10-22 08:55 航空航天 -
肖克利的幽靈重現(xiàn)硅谷
2024-10-22 08:39 心智觀察所 -
中方代表:防止出現(xiàn)機(jī)器自主殺人
2024-10-22 08:26 科技前沿 -
中國(guó)科學(xué)家讓“死亡”50分鐘豬腦“復(fù)活”
2024-10-20 15:05 科技前沿 -
污蔑寧德時(shí)代,美國(guó)有著怎樣的怨念與悔恨?
2024-10-17 14:33 心智觀察所 -
我國(guó)成功發(fā)射高分十二號(hào)05星
2024-10-16 08:33 航空航天 -
我國(guó)首個(gè)空間科學(xué)規(guī)劃公布!明確這些目標(biāo)
2024-10-15 09:54 航空航天 -
拿下諾貝爾化學(xué)獎(jiǎng)的中國(guó)血統(tǒng),還將拯救谷歌?
2024-10-15 08:33 心智觀察所 -
星艦第五次試飛實(shí)現(xiàn)重大突破,但我國(guó)類似火箭可能得等一等
2024-10-13 23:04 航空航天 -
中國(guó)汽車電子產(chǎn)業(yè)將站上兩個(gè)世界之巔
2024-10-12 08:29 心智觀察所 -
世界最大!地下700米的這個(gè)玻璃球,將探尋宇宙之初
2024-10-11 10:00 科技前沿 -
我國(guó)成功發(fā)射衛(wèi)星互聯(lián)網(wǎng)高軌衛(wèi)星
2024-10-10 22:49 航空航天 -
我國(guó)科技成果轉(zhuǎn)化問(wèn)題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)揭曉
2024-10-07 17:45 諾貝爾獎(jiǎng)
相關(guān)推薦 -
商務(wù)部:中方?jīng)Q定同意與美方接觸 評(píng)論 325“指揮混亂!他突然擅自下令,特朗普都被蒙在鼓里” 評(píng)論 69后院起火?加拿大“最保守省”醞釀“獨(dú)立公投” 評(píng)論 125印外長(zhǎng)懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主… 評(píng)論 142最新聞 Hot
-
商務(wù)部:中方?jīng)Q定同意與美方接觸
-
特朗普拒不付錢(qián),加州又扯中國(guó)
-
歐洲最后一家關(guān)鍵抗生素原料商@歐盟:讓你不打錢(qián),我們?nèi)ブ袊?guó)了…
-
黃仁勛:錯(cuò)失中國(guó)市場(chǎng),損失巨大
-
特朗普:很遺憾
-
“加拿大永遠(yuǎn)不賣(mài)”“永遠(yuǎn)別說(shuō)永遠(yuǎn)”
-
“指揮混亂!他突然擅自下令,特朗普都被蒙在鼓里”
-
第二輪投票通過(guò),默茨正式當(dāng)選
-
18名議員跑票,默茨意外未能當(dāng)選德國(guó)總理
-
蘇丹宣布:與阿聯(lián)酋斷交
-
“很明顯,幾乎所有美國(guó)出口都受到了打擊”
-
“我們國(guó)家正處于脆弱時(shí)刻,美國(guó)卻在丑陋地炫耀權(quán)力”
-
涉1000億歐元美國(guó)商品,歐盟考慮:談不成就動(dòng)手
-
后院起火?加拿大“最保守省”醞釀“獨(dú)立公投”
-
日本先談判先遇挫,特朗普政府又臭又硬、寸步不讓
-
美財(cái)長(zhǎng)賣(mài)力為關(guān)稅洗地,臺(tái)下高管們只關(guān)注中國(guó)
-