您現(xiàn)在的位置：首頁(yè) > 科技 > 正文

AI成為數(shù)學(xué)家得力助手還要多久

時(shí)間：2025-06-19 10:10:41 來(lái)源：科技日?qǐng)?bào)

從計(jì)算機(jī)科學(xué)到醫(yī)學(xué)再到國(guó)家安全，數(shù)學(xué)是眾多關(guān)鍵應(yīng)用的基石，但數(shù)學(xué)領(lǐng)域的進(jìn)步可能需要數(shù)年時(shí)間才能實(shí)現(xiàn)。

幾百年來(lái)，數(shù)學(xué)家使用的工具依然簡(jiǎn)樸：一張紙、一支筆。他們憑借邏輯與靈感，在符號(hào)的迷宮中尋找通往真理的路徑。

為了打破這一局面，美國(guó)國(guó)防高級(jí)研究計(jì)劃局今年4月啟動(dòng)了“指數(shù)性數(shù)學(xué)”計(jì)劃，旨在開(kāi)發(fā)一種能極大提升數(shù)學(xué)研究效率的人工智能（AI）“合著者”系統(tǒng)。

幾十年來(lái)，數(shù)學(xué)家借助計(jì)算機(jī)進(jìn)行輔助計(jì)算或驗(yàn)證命題，如今的AI或許能更上層樓，挑戰(zhàn)那些人類(lèi)長(zhǎng)年未解的難題。不過(guò)，從能解高中題的AI，到能協(xié)助攻克前沿?cái)?shù)學(xué)難關(guān)的AI，中間仍隔著一道鴻溝。

解決重大難題仍力不從心

大型語(yǔ)言模型（LLM）并不擅長(zhǎng)數(shù)學(xué)。它們常常出現(xiàn)“幻覺(jué)”，甚至可能被誤導(dǎo)相信2+2=5。但新一代大型推理模型，如OpenAI的o3、Anthropic的Claude 4 Thinking等，展現(xiàn)出的進(jìn)步令數(shù)學(xué)家眼前一亮。

今年，這些模型在美國(guó)數(shù)學(xué)邀請(qǐng)賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過(guò)去“一錘定音”式的輸出，這些模型開(kāi)始嘗試模擬數(shù)學(xué)家逐步推理的思考過(guò)程。

同時(shí)，一些將LLM與某種事實(shí)核查系統(tǒng)相結(jié)合的新型混合模型也取得了突破。例如，谷歌“深度思維”的AlphaProof系統(tǒng)將語(yǔ)言模型與棋類(lèi)AI——AlphaZero結(jié)合，成為首個(gè)取得與國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽銀牌得主成績(jī)相當(dāng)?shù)南到y(tǒng)。今年5月，谷歌的AlphaEvolve模型更進(jìn)一步，在多個(gè)長(zhǎng)期未解的數(shù)學(xué)與計(jì)算難題上找到優(yōu)于人類(lèi)現(xiàn)有方案的解法。

美國(guó)《麻省理工科技評(píng)論》指出，盡管這些AI成績(jī)亮眼，但專(zhuān)家們普遍認(rèn)為，它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競(jìng)賽題雖難，卻更像是智力游戲，有一定“套路”。真正的數(shù)學(xué)研究則更開(kāi)放、更復(fù)雜。面對(duì)“P vs NP”“黎曼猜想”等重大難題時(shí)，AI仍力不從心。

為了更準(zhǔn)確地評(píng)估AI的能力，初創(chuàng)公司Epoch AI去年推出了FrontierMath測(cè)試，聯(lián)合60多位數(shù)學(xué)家設(shè)計(jì)出全新高難度題目，避開(kāi)模型已見(jiàn)過(guò)的訓(xùn)練數(shù)據(jù)，結(jié)果LLM幾乎集體“交白卷”。

這些測(cè)試表明，AI在數(shù)學(xué)道路上雖已邁步，但離“合著者”角色仍有很長(zhǎng)一段路要走。

需攻克“超長(zhǎng)推理鏈”

仔細(xì)觀(guān)察數(shù)學(xué)問(wèn)題會(huì)發(fā)現(xiàn)，它們?cè)谀承┓矫骖?lèi)似：解決問(wèn)題需完成一系列連續(xù)步驟，關(guān)鍵在于找到這些步驟。

美國(guó)加州理工學(xué)院謝爾蓋·古科夫指出，困難的差異往往體現(xiàn)在路徑的長(zhǎng)度上。高中數(shù)學(xué)可能只需10到40步，而像黎曼猜想這樣的難題，路徑可能長(zhǎng)達(dá)百萬(wàn)步。

這類(lèi)“超長(zhǎng)路徑”極難處理。就像下圍棋時(shí)尋找一條制勝序列，AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。而在數(shù)學(xué)中，這個(gè)復(fù)雜度要遠(yuǎn)超棋類(lèi)游戲。

據(jù)物理學(xué)家組織網(wǎng)今年2月報(bào)道，為應(yīng)對(duì)這一挑戰(zhàn)，古科夫團(tuán)隊(duì)開(kāi)發(fā)了一種方法，將多個(gè)步驟打包成“超級(jí)步驟”，相當(dāng)于穿上“巨人靴”跨越大段路程。他們?cè)O(shè)計(jì)了一個(gè)系統(tǒng)，其中強(qiáng)化學(xué)習(xí)模型負(fù)責(zé)提出超級(jí)步驟，另一個(gè)模型負(fù)責(zé)驗(yàn)證其合理性。

該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想，但借助AI，科學(xué)家推翻了一個(gè)40年來(lái)被廣泛引用的“反例”。這曾被視為證明該猜想錯(cuò)誤的關(guān)鍵依據(jù)。

牛津大學(xué)數(shù)學(xué)家馬丁·布里森對(duì)此表示肯定：“排除錯(cuò)誤路徑，是科研中非常有價(jià)值的一步。”

古科夫相信，這種“壓縮路徑”的思路適用于所有需要推理鏈條的領(lǐng)域。他希望，這種方法不僅能推動(dòng)AI跳出固有模式，也為數(shù)學(xué)研究帶來(lái)新突破。

真正的創(chuàng)新和突破仍屬人類(lèi)

跳出思維定式，正是數(shù)學(xué)家攻克難題的關(guān)鍵。數(shù)學(xué)常被看作機(jī)械推理，而高等數(shù)學(xué)則更像是一場(chǎng)實(shí)驗(yàn)，充滿(mǎn)一波三折的試錯(cuò)與靈光乍現(xiàn)的頓悟。

這正是AlphaEvolve等AI工具的優(yōu)勢(shì)所在。它通過(guò)LLM不斷生成并改進(jìn)解題代碼，配合第二個(gè)模型評(píng)估每一輪結(jié)果，最終提出比人類(lèi)更優(yōu)的解法。這種方法不僅能獨(dú)立探索，也支持人類(lèi)隨時(shí)介入，提供靈感和指令。

澳大利亞悉尼大學(xué)數(shù)學(xué)家喬迪·威廉姆森強(qiáng)調(diào)，探索性思維是數(shù)學(xué)的核心。據(jù)英國(guó)《新科學(xué)家》網(wǎng)站報(bào)道，他與Meta合作開(kāi)發(fā)了PatternBoost AI系統(tǒng)，可根據(jù)一個(gè)數(shù)學(xué)想法生成相似概念，幫助激發(fā)靈感。他說(shuō)：“這就像是這里有一堆有趣的東西，我不知道是怎么回事，但你能再生成一些類(lèi)似的東西嗎？”

這種頭腦風(fēng)暴在數(shù)學(xué)中至關(guān)重要，它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過(guò)純粹推理發(fā)現(xiàn)了它，其形狀并不存在于自然界中，卻深刻影響了數(shù)學(xué)的發(fā)展。威廉姆森希望，AI未來(lái)也能協(xié)助發(fā)現(xiàn)類(lèi)似的“新數(shù)學(xué)對(duì)象”。

不過(guò)，目前AI仍缺乏真正的創(chuàng)造力。讓AI贏(yíng)棋是一回事，讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類(lèi)直覺(jué)的“偵察兵”，幫助人們發(fā)現(xiàn)路徑、避開(kāi)死路，但專(zhuān)家普遍認(rèn)為，真正的創(chuàng)新與突破，仍然屬于人類(lèi)。

關(guān)鍵詞：

上一篇：從“能用”到“好用”：AI激活醫(yī)療創(chuàng)新動(dòng)能
下一篇：最后一頁(yè)

相關(guān)新聞

丰满人妻熟妇乱又伦精品,最新国产精品精品视频视频,天堂а√中文最新版在线,成年网站未满十八禁

AI成為數(shù)學(xué)家得力助手還要多久

最近更新

特別關(guān)注

成都趙磊

永琰小楷書(shū)《御制詠文房四事詩(shī)》

今明兩天，這個(gè)停車(chē)場(chǎng)提供兩小時(shí)免費(fèi)服務(wù)！

Novitec為邁凱輪GT提供了近700bhp的功率

「遙遙領(lǐng)先」的領(lǐng)克 08，開(kāi)局就自「刀」

《數(shù)據(jù)資產(chǎn)評(píng)估指導(dǎo)意見(jiàn)》出臺(tái) 提供數(shù)據(jù)估值實(shí)操指南、強(qiáng)調(diào)質(zhì)量評(píng)價(jià)

威爾高：惠州威爾高電子有限公司是江西威爾高電子股份有限公司的全資子公司

貴州省第十屆慈善項(xiàng)目推介會(huì)在六盤(pán)水舉行

電科數(shù)字：2022年公司的華為消費(fèi)終端產(chǎn)品銷(xiāo)售和授權(quán)服務(wù)收入占營(yíng)收比重約1.25%

北京雨情：目前昌平、豐臺(tái)局地回波較強(qiáng)，未來(lái)兩小時(shí)將影響城區(qū)

焦點(diǎn)資訊