華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

新智元報道

編輯論文:元宇

【新智元導(dǎo)讀】用AI檢測AI幻覺,用魔法打敗魔法!剛剛,NeurIPS已收錄論文被曝出數(shù)百條AI幻覺引用,至少53篇論文中招論文。為了對抗AI幻覺、造假所帶來的學術(shù)「污染」,首先拿起AI武器的,也應(yīng)當是AI頂會。

數(shù)百項虛假引用論文,53篇頂會論文被抓包!

剛剛,NeurIPS頂會暴雷,全球AI圈的「奧斯卡」盛會,被一家華人00后的AI初創(chuàng)公司「打假」了論文。

這家名為GPTZero的公司在掃描了NeurIPS 2025年所接收的4841篇論文后,發(fā)現(xiàn)了數(shù)百條由AI「編造」出來的引用,至少53篇論文「證據(jù)確鑿」論文

GPTZero CEO Edward Tian將其稱作一個重要的節(jié)點時刻論文

這是首次有記錄顯示,幻覺引用進入了頂級機器學習會議的官方文獻論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

展開全文

GPTZero聯(lián)合創(chuàng)始人兼CEO Edward Tian(左)與聯(lián)合創(chuàng)始人兼CTO Alex Cui(右)論文

當「John Smith」這種占位符名字(類似中國的張三、李四),堂而皇之地出現(xiàn)在頂會參考文獻中,這意味著學術(shù)研究的基石已經(jīng)被AI幻覺「侵蝕」了論文。

更離譜的是,在GPTZero展示的例子中,圖靈獎得主Yann LeCun的名字,以「Samuel LeCun Jackson」的虛構(gòu)引用形式,出現(xiàn)在了另一篇有關(guān)深度學習的論文中論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

學術(shù)引用的嚴謹性對于科研的意義不言而喻論文

當謊言被引用了一千次,它在數(shù)據(jù)集中就變成了真理論文。

如果不加干預(yù),未來的研究者在引用這些「經(jīng)典」時,就像是在虛無縹緲的云端建造空中樓閣論文。

以前科學家們的研究是站在了巨人的肩膀上,今后很可能是站在AI的幻覺之上了論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

53篇論文驚現(xiàn)AI幻覺引用

頂會濾鏡破碎

在AI學術(shù)圈,NeurIPS長期以來被視為一座「圣殿」論文。

在這里發(fā)表論文,幾乎等同于拿到了進入Google DeepMind或OpenAI等頂級實驗室的入場券論文。

然而,這層看上去高大上的「神圣濾鏡」,卻被GPTZero擊碎了論文。

他們對NeurIPS 2025已正式發(fā)表的4841篇論文進行了一次「地毯式掃描」論文,結(jié)果猶如一記重磅炸彈:

至少53篇論文,被檢測出包含數(shù)百條由大模型憑空捏造的引用論文。

最令人震驚的是,這些連鏈接都可能指向404的低級錯誤,竟悉數(shù)「騙」過了每篇論文至少三名專家的同行評審防線論文

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

NeurIPS 2025現(xiàn)場

頂會的尊嚴,在AI幻覺面前,顯得不堪一擊論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

如上圖,在GPTZero的官方博客中,公布了53篇NeurIPS論文中發(fā)表的100條虛構(gòu)引用列表論文

在上圖所顯示的這篇論文中,GPTZero檢測到存在一篇標題相同的文章,作者顯然是偽造的論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

在上面這篇關(guān)于深度學習技術(shù)的論文中,顯示無作者或標題匹配,說明該文章不存在于出版物中,其URL和DOI均為偽造論文

GPTZero曾嘗試通過多種名稱來描述AI生成的幻覺引用論文。

「幻覺引用」(hallucinated citations)太長,「虛假引用」(fake citations)則帶有過強的道德評判色彩論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Alex Adams

最終,GPTZero機器學習主管Alex Adams提出了「氛圍引用」(vibe citing)一詞,用來描述大模型將真實來源進行推導(dǎo)或拼湊,從而生成看似逼真卻是虛假信息的傾向論文。

「氛圍引用」與「氛圍寫作」(vibe writing)或「氛圍編碼」(vibe coding)類似,其生成的引用乍看之下似乎準確無誤,但經(jīng)不起仔細推敲論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

利用AI撰寫研究論文迅速流行,體現(xiàn)了「氛圍引用」(vibe-citing)的快速增長

從上圖中可以看出,2025年4月和9月的峰值分別對應(yīng)NeurIPS和ICLR 2025的論文提交截止日期論文

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

AI幻覺的進化

Edward Tian認為,NeurIPS的情況更令人擔憂,因為問題出現(xiàn)在已經(jīng)被正式接收并發(fā)表的論文中論文。

根據(jù)傳統(tǒng)的學術(shù)規(guī)范,即便只有一條偽造引用,也足以構(gòu)成拒稿理由論文

NeurIPS 2025主賽道論文的接收率為24.52%,這意味著這些存在幻覺引用的論文擊敗了約15000篇競爭對手論文

這些「AI幻覺」造成的引用問題,通過了同行評審,并被收錄進最終的會議論文集論文。

因此,Edward Tian認為這次問題,相比以往是一次明顯的升級,也是首次有記錄顯示幻覺引用進入了頂級機器學習會議的官方文獻論文。

在GPTZero曝光的部分案例中,我們看到了AI幻覺的驚人進化論文

最初級錯誤

最初級錯誤,是論文參考文獻中出現(xiàn)了「John Smith」和「Jane Doe」這樣的占位姓名,甚至還有引用鏈接直接指向404空頁面論文。

而且,這種初級錯誤竟然逃過了世界頂級專家的法眼論文。

「半真半假」的隱蔽偽造

這是一種更危險、更深度,也更隱蔽的一種偽造論文。

AI可能會把多篇真實論文的內(nèi)容拼接或改寫,生成看起來十分可信的標題和作者列表論文

它還會把一篇題為「深度學習的優(yōu)化」的論文,改寫成「深度學習中的優(yōu)化策略」論文。

乍看上去作者和關(guān)鍵詞都對,格式也是BibTeX的標準格式論文

審稿人在快速瀏覽時,大腦會自動補全這些信息,覺得這篇文獻很眼熟,于是就通過了論文。

GPTZero之所以能發(fā)現(xiàn)「AI幻覺」,是因為它的結(jié)果是基于事實的對照論文。

據(jù)Alex Cui介紹,GPTZero的幻覺檢測工具會讀取論文全文,通過搜索開放網(wǎng)絡(luò)和學術(shù)數(shù)據(jù)庫,逐條核實引用的作者、標題、發(fā)表渠道和鏈接論文

如果一條引用在現(xiàn)實世界找不到對應(yīng),或者只與真實論文部分匹配,系統(tǒng)就會拉響警報論文。

失守的防線

「投稿海嘯」與審稿過載困境

如此低級的錯誤論文,為什么會繞過層層把關(guān)的審稿系統(tǒng)?

答案很現(xiàn)實:由于內(nèi)卷,學術(shù)界的「算力」已經(jīng)跟不上了論文。

ICLR、NeurIPS、ICML和AAAI這些全球AI頂會,每年吸引數(shù)千篇投稿和大量參與者論文

由于AI、論文工廠以及發(fā)表壓力所引發(fā)的「投稿海嘯」,已使所有這些會議的審稿流程不堪重負,瀕臨崩潰論文。

比如,2020年至2025年間,NeurIPS的投稿量從9467篇激增超過220%,達到21575篇,遠高于2024年的15671篇和2023年的12343篇論文

即便會議組織者動員了成千上萬名志愿評審,但對于每篇論文及其參考文獻進行深入審查也變得越來越難論文

這就為AI幻覺的出現(xiàn)留下了可乘之機論文。

對此論文,NeurIPS理事會的官方回應(yīng)顯然有些蒼白:

1.1%的論文因使用大模型而包含一個或多個錯誤引用,也并不意味著論文內(nèi)容本身一定無效論文。例如,作者可能只是向大模型提供了不完整的引用信息,并讓模型生成BibTeX(格式化參考文獻)。

但是,這種說法在學術(shù)態(tài)度上也無法站住腳論文

如果一位作者連自己的參考文獻都懶得核實論文,直接甩給AI去生成,且不進行復(fù)查,我們又怎能相信他在復(fù)雜的實驗數(shù)據(jù)上保持了嚴謹?

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

就像Hacker News中一位網(wǎng)友說的那樣,看到這些被標注錯誤的論文,會讓自己停下來思考:這篇論文的其它部分有多少是借助了AI輔助完成的論文。

「如果這些是僅有的錯誤,我們并不擔憂,但無法確定這些就已經(jīng)是全部的錯誤論文。這些錯誤表明該論文在提交時未經(jīng)過徹底的幻覺檢查,作者在使用AI時也缺乏應(yīng)有的謹慎。」

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

用魔法打敗魔法

NeurIPS「翻車」不止是「氛圍引用」那么簡單,它動搖的是科研誠信的基石論文。

科研就像一場接力賽論文。以AI研究為例,它高度依賴「可復(fù)現(xiàn)性」和「溯源」。

就像Edward Tian所說的:「AI研究結(jié)果向來難以復(fù)現(xiàn),因此引用至關(guān)重要論文。」

真實準確的引用,能幫助研究者判斷某個結(jié)果是否可復(fù)現(xiàn),并讓他人追溯到具體、可驗證的來源進行測試論文。

因此論文,如果「氛圍引用」的現(xiàn)象不加以遏制,我們將面臨一種可怕的「近親繁殖」效應(yīng):

AI生成了包含幻覺的論文,這些論文被收錄進數(shù)據(jù)庫,下一代AI模型又拿這些數(shù)據(jù)進行訓練論文

最終,AI開始從自己的幻覺中學習知識,導(dǎo)致模型的崩塌論文

GPTZero的曝光旨在警示行業(yè)漏洞:舊有的「評審體系」,已難以應(yīng)對投稿量激增和AI使用所帶來的問題論文。

如何捍衛(wèi)同行評審的尊嚴論文?

另一大頂會ICLR(國際表征學習大會)已經(jīng)覺醒并開始行動論文。

ICLR將于今年4月舉辦,吸取了NeurIPS的教訓后,它迅速聯(lián)手GPTZero,已啟動了嚴格的「排雷」行動論文

此前,在GPTZero針對ICLR的一項投稿調(diào)研中,已經(jīng)發(fā)現(xiàn)了50條成功躲過評審的虛假引用論文。

去年11月,ICLR還發(fā)布了關(guān)于大模型生成論文及評審的應(yīng)對策略論文

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

ICLR發(fā)出的信號非常明確:不封殺AI,但必須透明論文。

幻覺引用被定性為違反「道德準則」(Code of Ethics),一旦發(fā)現(xiàn)大量使用AI未披露或存在虛假內(nèi)容,將直接拒稿/桌拒(Desk Reject)論文

更狠的是,審稿人亂用AI,自己的投稿也將面臨被拒的連帶懲罰論文。

此外,ICLR還提到為了避免誤判,會結(jié)合工具篩選和人工復(fù)核,試圖通過「人機共治」,筑起抵御虛假內(nèi)容的新防線論文。

在AI時代,同行評審機制正被迫進行一場自我進化論文。

用AI檢測AI幻覺,用魔法打敗魔法論文

為了應(yīng)對AI幻覺或造假帶來的學術(shù)「污染」,首先拿起AI武器的,也應(yīng)當是這些AI頂會論文。

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

GPTZero背后的兩位年輕創(chuàng)始人

GPTZero之所以能在AI檢測領(lǐng)域迅速嶄露頭角,離不開它兩位年輕創(chuàng)始人的完美互補論文。

Edward Tian

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Edward Tian

Edward Tian是GPTZero的CEO ,也是一位擁有華人背景的00后創(chuàng)業(yè)者論文

就讀普林斯頓大學期間,他主修計算機科學,并輔修新聞方向;在創(chuàng)立GPTZero之前,他曾在Microsoft AI從事過研究工作,也做過BBC調(diào)查報道相關(guān)實踐論文

這些經(jīng)歷讓他更早意識到:當生成式AI大規(guī)模普及后,「內(nèi)容真實性」與「學術(shù)誠信」將面臨新的挑戰(zhàn)論文

2022年底ChatGPT上線引爆關(guān)注之后,Edward Tian在寒假期間快速做出了GPTZero的產(chǎn)品原型,并將困惑度(perplexity)與突發(fā)性(burstiness)等統(tǒng)計特征作為檢測的重要指標論文

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

他認為人類寫作在這兩項指標上通常表現(xiàn)出更強的隨機性和結(jié)構(gòu)波動,據(jù)此能夠推測出一段文字是人工撰寫還是AI生成的論文。

Alex Cui

華裔00后戳破頂會泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Alex Cui

Alex Cui是GPTZero的聯(lián)合創(chuàng)始人兼CTO論文。

他在多倫多大學完成計算機科學碩士學位論文。在加入GPTZero之前,曾在自動駕駛公司W(wǎng)aabi擔任研究科學家。

作為GPTZero的CTO,Alex負責推進包括為微軟和谷歌產(chǎn)品開發(fā)的插件,幫助用戶在任何文檔或網(wǎng)站上檢測AI生成的文本論文。

二人并非臨時組隊,而是高中時期的好友論文。GPTZero早期團隊組建時,Edward便邀請Alex加入并負責技術(shù)推進。

參考資料論文

秒追ASI

本站內(nèi)容來自用戶投稿,如果侵犯了您的權(quán)利,請與我們聯(lián)系刪除。聯(lián)系郵箱:[email protected]

本文鏈接://m.cqlhyz.com/post/8202.html

?? /
欧美亚洲日韩国产综合每日更新,国产美女一级A作爱在线观看,亚洲欧洲国产1区二区,国产高清无码精油按摩