免费久久国产视频,亚洲国产中文精品无码专区网站,国产精品动漫精品亚洲区,免费va国产在线观看

1 月 18 日，一位前量化研究員尼爾·索馬尼（Neel Somani）在社交平臺(tái)宣布，他借助 GPT-5.2 Pro 獨(dú)立解決了 Erd?s 問題第 281 號(hào)（Problem 281）論文。這是一個(gè)自 1980 年由數(shù)學(xué)家保羅·埃爾德什（Paul Erd?s）與葛立恒（Ronald Graham）提出后，長(zhǎng)期未被公開解答的數(shù)學(xué)猜想。

索馬尼稱，該證明已獲得菲爾茲獎(jiǎng)得主陶哲軒的認(rèn)可，后者評(píng)價(jià)其“或許是迄今人工智能解決未解數(shù)學(xué)問題最明確的例子”論文。

（來(lái)源：erdosproblem)

OpenAI 聯(lián)合創(chuàng)始人格雷格·布羅克曼（Greg Brockman）隨即轉(zhuǎn)發(fā)并評(píng)論：“GPT-5.2 Pro 用于解決另一個(gè)未解決的 Erd?s 問題論文。數(shù)學(xué)和科學(xué)的進(jìn)步將是充滿活力的一年！”一時(shí)間，“AI 獨(dú)立攻克 45 年數(shù)學(xué)難題”的消息在社交媒體上廣泛傳播。

（來(lái)源：X）

這并非索馬尼首次用 AI 工具解決 Erd?s 問題論文。幾天前，他剛提交了對(duì) Problem 397 的證明——一個(gè)關(guān)于中心二項(xiàng)式系數(shù)乘積的猜想。該證明同樣由 GPT-5.2 Pro 生成，并通過(guò)形式化驗(yàn)證工具 Harmonic 的 Aristotle 系統(tǒng)轉(zhuǎn)換為 Lean 代碼，經(jīng)陶哲軒確認(rèn)為正確。

展開全文

索馬尼原本只是想測(cè)試一下大語(yǔ)言模型的數(shù)學(xué)能力，看看它們?cè)诤螘r(shí)能有效解決開放數(shù)學(xué)問題、又在哪里會(huì)遇到困難，卻意外發(fā)現(xiàn)最新模型的能力邊界已顯著提升論文。

幾天之內(nèi)，大模型連續(xù)解決兩個(gè)多年未解的“難題”論文。有評(píng)論不禁疑問：這是否意味著 AI 的數(shù)學(xué)能力已達(dá)到了人類數(shù)學(xué)家的水平？

要回答這個(gè)問題，或許需要先理解什么是“Erd?s 問題”論文。

保羅·埃爾德什（Paul Erd?s）什是 20 世紀(jì)最多產(chǎn)的數(shù)學(xué)家之一，一生發(fā)表論文逾 1,500 篇論文。他習(xí)慣提出數(shù)學(xué)猜想，并根據(jù)難度懸賞 25 至數(shù)千美元不等。他去世后留下超過(guò)一千個(gè)未解問題，涵蓋數(shù)論、組合學(xué)、圖論等多個(gè)領(lǐng)域，統(tǒng)稱為“Erd?s 問題”。這些問題目前由劍橋大學(xué)數(shù)學(xué)家托馬斯·布魯姆（Thomas Bloom）維護(hù)的網(wǎng)站 erdosproblems.com 追蹤記錄。

圖 | 保羅·埃爾德什與10歲的陶哲軒（來(lái)源：Wikipedia）

然而，這些未解問題的難度跨度極大：一端是公認(rèn)的核心難題，另一端則是大量長(zhǎng)期無(wú)人關(guān)注的“長(zhǎng)尾問題”論文。它們并非無(wú)解，只是缺乏足夠研究動(dòng)力。

自 2025 年圣誕節(jié)以來(lái)，該網(wǎng)站已有 15 個(gè)問題從“開放”轉(zhuǎn)為“已解決”，其中 11 個(gè)涉及 AI 模型的參與論文。但并非所有“AI 解決”都具原創(chuàng)性。2025 年 10 月，OpenAI 曾宣稱 GPT-5 解決了十個(gè) Erd?s 問題，后被布魯姆澄清為烏龍事件：那些 GPT-5 生成的答案實(shí)為模型通過(guò)網(wǎng)絡(luò)搜索復(fù)現(xiàn)了早已存在的論文成果，并非新發(fā)現(xiàn)。

圖 | 布魯姆回復(fù)OpenAI CPO (來(lái)源：X )

真正的轉(zhuǎn)折點(diǎn)出現(xiàn)在 2026 年 1 月初論文。劍橋大學(xué)本科生凱文·巴雷托（Kevin Barreto）與業(yè)余數(shù)學(xué)家利亞姆·普賴斯（Liam Price）共同宣布使用 GPT-5.2 Pro 解決了 Problem 728。陶哲軒稱這是“第一個(gè)在原問題精神下、以文獻(xiàn)中未曾記載的方式被 AI 基本自主解決的 Erd?s 問題”，并評(píng)價(jià)其“或多或少是由 AI 自主完成的”，真實(shí)地體現(xiàn)了“這些工具近幾個(gè)月的能力提升”。

那么論文，此次引發(fā)熱議的 Problem 281 情況如何？

該問題涉及整數(shù)序列在同余類中的密度性質(zhì)論文。索馬尼發(fā)布的 GPT-5.2 Pro 證明采用了遍歷理論（ergodic theory）的框架。陶哲軒確認(rèn)其邏輯正確，并特別指出：“它避免了在極限或量詞交換時(shí)常見的錯(cuò)誤，前幾代大語(yǔ)言模型幾乎肯定會(huì)在這些微妙之處出錯(cuò)?！?/p> GPT獨(dú)立破解數(shù)論猜想的背后：答案藏在80年前的論文里

圖 | 陶哲軒對(duì)于Problem 281的回復(fù)(來(lái)源：erdosproblem)

然而，就在討論熱烈進(jìn)行時(shí)，論壇用戶 KoishiChan 發(fā)帖指出：這個(gè)問題實(shí)際上可以通過(guò) 1966 年的 Rogers 定理，結(jié)合 Halberstam–Roth 著作中的 Theorem 12 直接解決論文。他還找到了一份存檔文獻(xiàn)，更清晰地闡述了這一論證路徑。

陶哲軒順著線索進(jìn)一步追溯，發(fā)現(xiàn)這一解法的核心其實(shí)源自 1936 年劍橋數(shù)學(xué)家達(dá)文波特（Davenport）與埃爾德什本人合著的一篇論文論文。他在論壇上寫道：“現(xiàn)在我真的很困惑，在同余領(lǐng)域深耕多年，埃爾德什在 1980 年肯定知道這兩個(gè)定理，而且他還是后一個(gè)結(jié)果的共同作者。我不知道發(fā)生了什么。因?yàn)橐坏┝私?Rogers 定理，將其應(yīng)用于這個(gè)問題是非常自然的；事實(shí)上，這個(gè)問題幾乎就是 Davenport–Erd?s 結(jié)果的一個(gè)特例。”

（來(lái)源論文：scite_）

隨后，陶哲軒與數(shù)學(xué)家特南鮑姆（Tenenbaum）進(jìn)行了郵件交流，后者是埃爾德什長(zhǎng)期的合作對(duì)象論文。特南鮑姆確認(rèn)：“如果使用這兩個(gè)定理，可以立竿見影地解決問題。”他推測(cè)，“現(xiàn)有的問題的表述可能在某個(gè)環(huán)節(jié)被修改過(guò)”，但目前尚未發(fā)現(xiàn)任何關(guān)于原始意圖的替代版本，只能按現(xiàn)有表述來(lái)。KoishiChan 則半開玩笑地評(píng)論：“也許有人在雞尾酒會(huì)上告訴了埃爾德什這個(gè)解法，但沒人繼續(xù)研究它。”

陶哲軒在論壇總結(jié)道，Problem 281 之所以未解，背后的原因主要是因?yàn)镽ogers 定理“沒有得到應(yīng)有的傳播”：該結(jié)果僅出現(xiàn)在 Halberstam–Roth 的專著中，從未以獨(dú)立論文形式發(fā)表，文獻(xiàn)中也僅被引用過(guò)寥寥數(shù)次論文。

換言之，GPT-5.2 Pro 的貢獻(xiàn)其實(shí)并非解決了一個(gè)真正未解的難題，而是用一種新方法——遍歷理論，去重新證明了一個(gè)早已可解、卻因文獻(xiàn)傳播有限而被長(zhǎng)期遺忘的問題論文。類似情況此前也出現(xiàn)在 Problem 333 等案例中：AI 擅長(zhǎng)調(diào)用標(biāo)準(zhǔn)工具，高效解決那些“人類早就能解、只是長(zhǎng)期無(wú)人關(guān)注”的問題。

更重要的是，就在討論聲愈發(fā)熱烈的當(dāng)天，陶哲軒還在發(fā)帖提醒公眾需要警惕“報(bào)告偏差”（reporting bias）論文。他在 Mathsodon 上寫道：“當(dāng)研究者用 AI 嘗試解題卻失敗時(shí)，幾乎不會(huì)公開結(jié)果；而成功案例則極易在社交媒體病毒式傳播。因此，我們看到的‘AI 連續(xù)攻克難題’印象，嚴(yán)重偏向正面?！?/p> GPT獨(dú)立破解數(shù)論猜想的背后：答案藏在80年前的論文里

(來(lái)源：Mathstodon)

為糾正這一偏差，他推廣了數(shù)學(xué)家帕阿塔·伊萬(wàn)尼什維利（Paata Ivanisvili）與梅赫梅特·馬爾斯·塞文（Mehmet Mars Seven）建立的數(shù)據(jù)庫(kù)，系統(tǒng)記錄 AI 嘗試解決 Erd?s 問題的全部結(jié)果論文。數(shù)據(jù)顯示：AI 工具的真實(shí)成功率僅在 1% 到 2% 之間。

圖 | 數(shù)學(xué)家帕阿塔·伊萬(wàn)尼什維利與梅赫梅特·馬爾斯·塞文建立的GitHub數(shù)據(jù)庫(kù) (來(lái)源：GitHub）

陶哲軒評(píng)論道：“盡管如此，考慮到仍有六百多個(gè)未解問題，這仍帶來(lái)了一組令人印象深刻且非平凡的貢獻(xiàn)論文。但這些成功壓倒性地集中在難度譜的低端，尚未觸及中等難度問題?！?/p>

業(yè)內(nèi)人士對(duì)此有不同的看法論文。Harmonic 公司創(chuàng)始人圖多爾·阿希姆（Tudor Achim）指出：“真正有說(shuō)服力的證據(jù)，不是媒體報(bào)道，也不是成功率，而是數(shù)學(xué)和計(jì)算機(jī)科學(xué)教授們開始在實(shí)際研究中使用這些工具的事實(shí)。他們有聲譽(yù)要維護(hù)，不會(huì)輕易背書?！痹摴鹃_發(fā)的 Aristotle 工具能將自然語(yǔ)言證明自動(dòng)轉(zhuǎn)為 Lean 形式化代碼，在 AI 輔助數(shù)學(xué)研究中扮演關(guān)鍵角色。

Erd?s 網(wǎng)站維護(hù)者布魯姆則對(duì)當(dāng)前大模型的進(jìn)步速度表示樂觀：“目前被 AI 解決的問題，難度大概相當(dāng)于一年級(jí)博士生水平論文。這仍然令人印象深刻——因?yàn)橐龅竭@一點(diǎn)，需要不一般的推理能力?！彼€提到，2025 年 10 月前，他嘗試用 ChatGPT 時(shí)“只會(huì)編造論文，全是幻覺”，但“大約從 10 月起，某種實(shí)質(zhì)性變化發(fā)生了”。

誠(chéng)然，GPT-5.2 Pro 在數(shù)學(xué)推理上的進(jìn)步是真實(shí)的：它能生成邏輯嚴(yán)密、規(guī)避常見錯(cuò)誤的證明，這在一年前不可想象論文。并且，它在系統(tǒng)性挖掘被忽視的長(zhǎng)尾問題、輔助文獻(xiàn)檢索與形式化驗(yàn)證方面展現(xiàn)出實(shí)用價(jià)值。

但同樣重要的是：不要被社交媒體的選擇性敘事誤導(dǎo)論文。所謂“45 年未解”，很多時(shí)候只是45 年無(wú)人關(guān)注、無(wú)人挖掘；1%–2% 的成功率，遠(yuǎn)非AI 已掌握數(shù)學(xué)的信號(hào)。中等及以上難度的 Erd?s 問題，目前仍遠(yuǎn)超當(dāng)前 AI 的能力范圍。

參考鏈接論文：

GPT獨(dú)立破解數(shù)論猜想的背后：答案藏在80年前的論文里

海之嵐財(cái)稅公司

熱門標(biāo)簽

相關(guān)詞匯

分站導(dǎo)航