arXiv開始拒收綜述論文了?「論文DDoS」這事,這篇NeurIPS論文早有討論

arXiv開始拒收綜述論文了?「論文DDoS」這事,這篇NeurIPS論文早有討論

近日,全球人工智能和計(jì)算機(jī)科學(xué)學(xué)術(shù)圈被一條消息刷屏:arXiv,這個(gè)領(lǐng)域內(nèi)最重要的預(yù)印本服務(wù)器,突然宣布了一項(xiàng)重大的實(shí)踐更新論文。

即日起,所有投稿至 arXiv 計(jì)算機(jī)科學(xué)分類的綜述性文章(review/survey)和立場(chǎng)性文章(position paper),必須首先通過期刊或正式會(huì)議的同行評(píng)審,并附上已獲接收的證明,否則很可能會(huì)被拒絕論文

消息一出,科研圈一片嘩然論文。arXiv 明確指出,這場(chǎng)風(fēng)波的源頭正是生成式 AI 與大語(yǔ)言模型。

然而,就在 arXiv 官方拉響警報(bào)的前幾周,一篇中稿 2025 年 NeurIPS Position Paper Track 的立場(chǎng)性文章恰好也登上了 arXiv論文。它的標(biāo)題精準(zhǔn)地概括了這場(chǎng)危機(jī):《Stop DDoS Attacking the Research Community with AI-Generated Survey Papers》。來(lái)自上海交通大學(xué)的研究團(tuán)隊(duì)精準(zhǔn)地預(yù)見、識(shí)別、量化并命名了這場(chǎng)由大模型引發(fā)的學(xué)術(shù)界危機(jī)。該論文的作者團(tuán)隊(duì)來(lái)自上海交通大學(xué),第一作者為安泰智能計(jì)算研究院助理教授林江浩,通訊作者為計(jì)算機(jī)學(xué)院張偉楠教授。

arXiv開始拒收綜述論文了?「論文DDoS」這事,這篇NeurIPS論文早有討論

論文標(biāo)題:Stop DDoS Attacking the Research Community with AI-Generated Survey Papers

論文鏈接論文

AI 綜述不僅是洪水漫灌論文,更是 DDoS 攻擊

這篇論文的核心貢獻(xiàn),在于提出了一個(gè)極度精準(zhǔn)的隱喻:“綜述論文 DDoS 攻擊”(Survey Paper DDoS attack)論文。這個(gè)概念的精妙之處在于,它點(diǎn)明了問題的本質(zhì)遠(yuǎn)非 “論文太多、大水漫灌” 那么簡(jiǎn)單。

展開全文

什么是技術(shù)上的 DDoS 攻擊?在計(jì)算機(jī)網(wǎng)絡(luò)安全領(lǐng)域,拒絕服務(wù)攻擊(Denial-of-Service Attack,DDoS)是指黑客利用大量 “僵尸電腦”,向一個(gè)目標(biāo)服務(wù)器發(fā)送海量的無(wú)意義請(qǐng)求流量,耗盡服務(wù)器的處理能力,導(dǎo)致真正的用戶無(wú)法訪問服務(wù)論文

什么是 “綜述論文 DDoS 攻擊”?它指的是不受控制地?cái)U(kuò)散那些表面上全面,但實(shí)際上冗余、低質(zhì)量,甚至包含幻覺的 AI 生成綜述論文,通過預(yù)印本平臺(tái)大規(guī)模進(jìn)入學(xué)術(shù)界論文。這些大批量 AI 綜述的攻擊目標(biāo)不是服務(wù)器,而是學(xué)術(shù)界最稀缺的資源:研究人員的有限注意力和同行評(píng)審的有限容量。

這導(dǎo)致的后果和 DDoS 攻擊一樣,它構(gòu)成了事實(shí)上的 “拒絕服務(wù)”論文。當(dāng)有價(jià)值的、深刻的見解被海量的 AI 生成內(nèi)容所淹沒時(shí),研究人員(尤其是新手)就等于被 “拒絕訪問” 到真正的學(xué)術(shù)洞察,研究者的有限注意力也將被無(wú)限分散。

arXiv 的緊急措施,就是這臺(tái) “服務(wù)器” 在不堪重負(fù)時(shí),被迫切斷部分流量的無(wú)奈之舉論文。

量化證據(jù)鏈論文:“后 2022 時(shí)代” 的數(shù)據(jù)激增

這篇論文中,作者們通過實(shí)證與數(shù)據(jù)分析,精準(zhǔn)量化、驗(yàn)證并揭示了這場(chǎng) “綜述論文 DDoS 攻擊” 的規(guī)模和來(lái)源論文。

他們收集并分析了 2020 年至 2024 年間 arXiv 上共計(jì) 10,063 篇 CS 領(lǐng)域的綜述論文論文。研究結(jié)果(如下圖)揭示了一個(gè)清晰無(wú)誤的轉(zhuǎn)折點(diǎn) ——“后 2022 年激增”(Post-2022 Spike)。

arXiv開始拒收綜述論文了?「論文DDoS」這事,這篇NeurIPS論文早有討論

論文從三個(gè)維度進(jìn)行量化分析:

1. CS 綜述論文總量:呈爆發(fā)式增長(zhǎng),尤其在 2022 年以后,論文數(shù)量激增,研究者已不堪重負(fù)論文。

2. 平均 AI 生成分?jǐn)?shù):AI 內(nèi)容檢測(cè)分?jǐn)?shù)翻了一倍多,清晰表明 AI 是這場(chǎng)增長(zhǎng)的核心驅(qū)動(dòng)力論文。

3. 可疑的發(fā)表行為:那些在短期內(nèi)(一個(gè)月內(nèi))以極少合作者(少于 2 人)發(fā)表超過 3 篇綜述的異常作者數(shù)量激增,指向 AI 輔助下的批量生產(chǎn)論文。

而 2022 年底,正是 ChatGPT 發(fā)布并引發(fā)全球生成式 AI 浪潮的時(shí)刻論文。這映證了學(xué)術(shù)界正在經(jīng)歷的不是正常的學(xué)術(shù)增長(zhǎng),而是一場(chǎng)由 AI 工具驅(qū)動(dòng)的、混雜著大量可疑動(dòng)機(jī)的內(nèi)容沖擊。

為了確保量化分析結(jié)論的穩(wěn)健性,該團(tuán)隊(duì)還使用了多種不同的 AI 內(nèi)容檢測(cè)器(如 DeTeTeCtive, MAGE)和規(guī)則式方案(如引用重復(fù)度、語(yǔ)義相似性)進(jìn)行交叉驗(yàn)證,結(jié)果均顯示了同樣的后 2022 年激增趨勢(shì)論文。

危害:不只是 “噪音”論文,更是 “文獻(xiàn)投毒”

如果 AI 生成的綜述只是數(shù)量多,那它們僅僅是噪音論文。但這篇論文指出,真正致命的是其質(zhì)量參差不齊、重復(fù)冗余的特性,這正在對(duì)學(xué)術(shù)生態(tài)造成系統(tǒng)性破壞。

傳統(tǒng)的、由專家撰寫的綜述是學(xué)術(shù)的燈塔,它們提供深刻的洞見、批判性的分析和高屋建瓴的分類論文。而 AI 生成的綜述,往往存在以下四種典型缺陷:

1. 結(jié)構(gòu)性空洞(Structural Differences):它們通常只是 “無(wú)組織的主題枚舉”,缺乏清晰的敘事流程和邏輯結(jié)構(gòu)論文。讀起來(lái)就像是一份沒有靈魂的文獻(xiàn)清單。

2. 缺乏創(chuàng)新的分類法(Lack of Novel Taxonomy):高質(zhì)量綜述的核心價(jià)值是提出全新的視角和分類體系論文。而 AI 綜述只會(huì) “模仿現(xiàn)有的分類”,有時(shí)甚至只是拙劣地復(fù)述維基百科的詞條。

3. 引文與內(nèi)容錯(cuò)漏(Citation and Content Inaccuracy): AI 綜述極有可能出現(xiàn)捏造的或不正確的參考文獻(xiàn)與內(nèi)容論文。這就是 LLM 的幻覺問題,它正在被不加鑒別地復(fù)制粘貼到本應(yīng)嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)記錄中,并且在下一輪 AI 深度調(diào)研中被進(jìn)一步廣播。

4. 高度冗余和極低的邊際效用(Redundancy and Low Marginal Utility):AI 極大地降低了 “灌水” 成本論文。論文作者觀察到,某個(gè)新興主題在短短一個(gè)月內(nèi)就出現(xiàn)了超過五篇的綜述預(yù)印本。這絕對(duì)是多余的,當(dāng) “第 N 篇關(guān)于 X 的綜述” 發(fā)表時(shí),其 “邊際學(xué)術(shù)價(jià)值幾乎為零”。

當(dāng)這四個(gè)要素結(jié)合在一起論文,由 “綜述論文 DDoS 攻擊” 產(chǎn)生了 “文獻(xiàn)投毒”(Literature Poisoning)現(xiàn)象:

綜述論文是新入行的研究生和跨領(lǐng)域?qū)W者的 “第一站” 和 “入門指南”論文。如果這些指南本身就充滿了 AI 的幻覺、錯(cuò)誤的引用和膚淺的分類,那么下一代的研究人員從一開始就可能被植入了錯(cuò)誤的學(xué)術(shù)前提。

更糟糕的是,這些低質(zhì)量的 AI 綜述開始互相引用,在學(xué)術(shù)搜索引擎(如谷歌學(xué)術(shù))上制造虛假繁榮,形成自我強(qiáng)化的循環(huán)論文。最終,垃圾文獻(xiàn)看起來(lái)引用量很高,而真正奠基性的工作反而被埋沒。這不僅扭曲了學(xué)術(shù)評(píng)價(jià)體系,更從根本上侵蝕了整個(gè)學(xué)術(shù)界的信任根基。

出路論文:從封堵到新機(jī)制構(gòu)建

面對(duì)如此嚴(yán)峻的 “DDDoS 攻擊” 和 “文獻(xiàn)投毒”論文,我們?cè)撛趺崔k?

例如 arXiv 的新規(guī)正是一種防御性的緊急熔斷措施論文。

該論文的作者也給出了自己的解決方案,分為兩部分:近期的務(wù)實(shí)策略和長(zhǎng)期的愿景革新論文。論文在文中提出了一系列政策建議,包括:

作者透明度要求:作者必須明確披露在寫作過程中對(duì) LLM 的使用情況論文。

對(duì)綜述提交進(jìn)行更嚴(yán)格的審查:例如,為綜述分配資深審稿人,并在審稿表格中增加特定問題,如本綜述是否引入了新的洞見或有意義的分類法論文

在審查中引入 AI 檢測(cè)和驗(yàn)證:使用工具進(jìn)行篩查,并抽查參考文獻(xiàn)的真實(shí)性論文。

激勵(lì)高質(zhì)量綜述:例如,設(shè)立最佳綜述論文獎(jiǎng),獎(jiǎng)勵(lì)質(zhì)量而非數(shù)量論文

更進(jìn)一步,作者們認(rèn)為,在 AI 時(shí)代,僅僅依靠 “封堵” 和 “提高門檻” 是被動(dòng)的,我們必須主動(dòng)擁抱變革,用更先進(jìn)的范式來(lái)解決問題論文。由此,作者們提出了一種構(gòu)想:動(dòng)態(tài)實(shí)時(shí)綜述(Dynamic Live Surveys, DLS)。

簡(jiǎn)單來(lái)說,不要再寫那種一次性的、靜態(tài)的、存在過時(shí)風(fēng)險(xiǎn)的 PDF 綜述了論文。我們應(yīng)該借鑒維基百科、GitHub、甚至 Google Doc 的平臺(tái),為每個(gè)研究領(lǐng)域建立一個(gè)由社區(qū)共同維護(hù)的、版本可控的在線知識(shí)庫(kù),并構(gòu)建 “人 - AI 協(xié)作的策展循環(huán)”(Human-AI Curation Loop):

AI 做它擅長(zhǎng)的:一個(gè) LLM 代理每天自動(dòng)掃描 arXiv、頂會(huì)等,抓取最新的論文、摘要、圖表和關(guān)鍵結(jié)果論文。它負(fù)責(zé)聚合和初步總結(jié)。

人做人擅長(zhǎng)的:真正的領(lǐng)域?qū)<医槿?,提?AI 無(wú)法給予的深度見解論文。他們負(fù)責(zé)提煉分類法、協(xié)調(diào)沖突的觀點(diǎn)、提供批判性分析和把握方向。

這種模式從根本上解決了現(xiàn)有問題:它能解決冗余(一個(gè)主題或分類方法只需要一個(gè) DLS),能保證質(zhì)量(由人類專家掌舵),也能解決時(shí)效性(實(shí)時(shí)更新)論文。

這種模式不再將 AI 視為洪水猛獸,而是將其轉(zhuǎn)變?yōu)閺?qiáng)大的科研助手,讓人類專家從繁瑣的文獻(xiàn)整理中解放出來(lái),專注于最高價(jià)值的思考和洞察論文

結(jié)語(yǔ)

arXiv 的新規(guī)是一個(gè)重要的信號(hào),它標(biāo)志著學(xué)術(shù)界對(duì) AI 沖擊波的被動(dòng)防御已經(jīng)開始論文。這是一個(gè)必要的 “止血帶”。

而上海交大團(tuán)隊(duì)的這篇論文,不僅精準(zhǔn)預(yù)言、量化并概括了這場(chǎng)危機(jī)(綜述論文 DDoS 攻擊和文獻(xiàn)投毒),更指明了一條可能的路徑措施論文。即,我們不能永遠(yuǎn)停留在 “提高圍墻” 的防御姿態(tài)上,在 AI 時(shí)代,我們必須主動(dòng)進(jìn)化,從靜態(tài)的、孤立的 “論文發(fā)表” 模式,轉(zhuǎn)向動(dòng)態(tài)的、協(xié)作的 “知識(shí)策展” 模式。

本站內(nèi)容來(lái)自用戶投稿,如果侵犯了您的權(quán)利,請(qǐng)與我們聯(lián)系刪除。聯(lián)系郵箱:[email protected]

本文鏈接://m.cqlhyz.com/post/1963.html

?? 簡(jiǎn) /
欧美亚洲日韩国产综合每日更新,国产美女一级A作爱在线观看,亚洲欧洲国产1区二区,国产高清无码精油按摩