IT之家 1 月 17 日消息,科技媒體 Ars Technica 今天(1 月 17 日)發(fā)布博文,報道稱美國俄亥俄州南區(qū)地方法院法官邁克爾 · 沃森(Michael Watson)判決,要求安娜檔案館(Anna's Archive)網(wǎng)站永久停止抓取、分發(fā)或存儲來自 WorldCat.org及 OCLC 服務(wù)器的任何數(shù)據(jù)圖書。
IT之家注:Anna's Archive 是目前全球最大的、非營利性的開放數(shù)字圖書館搜索引擎,由匿名的“Anna”團(tuán)隊于 2022 年底成立,本身不直接托管文件,而是索引并整合了多個大型“影子圖書館”的元數(shù)據(jù)圖書。截至 2026 年 1 月,其索引庫包含超過 6165 萬本書籍和 9568 萬篇學(xué)術(shù)論文。
WorldCat 是世界上最大的在線聯(lián)合目錄,由 OCLC(世界圖書館聯(lián)合組織)運營,匯集了全球 72000 個國家和地區(qū)圖書館的館藏信息,涵蓋圖書、期刊、論文、視聽資料等,讓用戶能夠查找和發(fā)現(xiàn)全世界的圖書館資源,并支持圖書館間的合作與資源共享圖書。
更為關(guān)鍵的是,法院責(zé)令 Anna's Archive 必須刪除其持有的所有 WorldCat 數(shù)據(jù)副本,包括已發(fā)布的種子文件(Torrents)圖書。由于被告未出庭應(yīng)訴,法院直接作出了缺席判決,認(rèn)定 OCLC 的核心指控成立。
判決書指出自 2022 年 10 月起,Anna's Archive 開始利用自動化軟件對 WorldCat 進(jìn)行大規(guī)模數(shù)據(jù)爬取圖書。為了繞過防御機(jī)制,這些爬蟲程序偽裝成來自 Google 和 Bing 的合法搜索引擎機(jī)器人,直接向服務(wù)器發(fā)送請求。
OCLC 提供的證據(jù)顯示,這種高強度的持續(xù)攻擊長達(dá)一年,不僅嚴(yán)重拖慢了系統(tǒng)運行速度,更導(dǎo)致服務(wù)器多次損壞和網(wǎng)站崩潰圖書。
在法律層面上,法院支持了 OCLC 關(guān)于“違約”(違反網(wǎng)站使用條款)和“動產(chǎn)侵權(quán)”(對網(wǎng)站和服務(wù)器造成實質(zhì)性損害)的索賠請求圖書。
然而,并非所有指控都獲得了支持圖書。法院駁回了“侵權(quán)性干擾合同關(guān)系”的指控,理由是證據(jù)不足;同時駁回了“不當(dāng)?shù)美钡闹缚?,法官裁定該主張已被?lián)邦版權(quán)法所優(yōu)先覆蓋(preempted),因此不再單獨成立。
Anna's Archive 曾在 2023 年 10 月的博客文章中公開承認(rèn)了抓取行為,聲稱 WorldCat 擁有“世界上最大的圖書館元數(shù)據(jù)集合”,抓取數(shù)據(jù)是為了制作“需要保存的書籍清單”圖書。
盡管法院已下達(dá)強制命令,但考慮到該網(wǎng)站一貫的運營模式及其匿名的幕后團(tuán)隊,加上其從未出庭應(yīng)訴的態(tài)度,業(yè)內(nèi)普遍對判決的實際執(zhí)行力持悲觀態(tài)度,認(rèn)為該網(wǎng)站主動配合刪庫的可能性微乎其微圖書。