央廣網(wǎng)北京2月12日消息(總臺(tái)中國之聲記者任夢巖)據(jù)中央廣播電視總臺(tái)中國之聲報(bào)道,最近字節(jié)跳動(dòng)推出的視頻模型Seedance2.0,引起全網(wǎng)熱議,通過幾句簡短的提示詞就能生成電影級(jí)的視頻素材。比如,某特工逃避追捕時(shí)撞翻了一箱水果,橘子和蘋果在空中飛舞的慢動(dòng)作等,都是由AI生成。再比如,兩位根本不在一本書里的動(dòng)畫人物,成了真人在演戲。過去我們常開玩笑說的關(guān)公戰(zhàn)秦瓊、黑貓警長大戰(zhàn)孫悟空,現(xiàn)在只需幾行提示詞,就能快速呈現(xiàn)。
但與此同時(shí)也有人發(fā)現(xiàn),該模型的模仿能力過強(qiáng),不僅可以生成現(xiàn)實(shí)生活中的人物視頻,還能高度還原語音語態(tài),令普通觀眾真假難辨素材。一名知名博主就在測試中發(fā)現(xiàn),僅將他自己的人臉照片上傳至模型,系統(tǒng)就能自動(dòng)生成與他本人高度相似的聲音。據(jù)了解,目前平臺(tái)已暫?!罢嫒怂夭膮⒖肌惫δ堋R曨l模型的高速發(fā)展,給隱私保護(hù)和素材安全提出哪些新課題?
這次更新的Seedance2.0有多強(qiáng)?與其他多模態(tài)大模型相比,有哪些優(yōu)勢?中關(guān)村現(xiàn)代信息消費(fèi)應(yīng)用產(chǎn)業(yè)技術(shù)聯(lián)盟副理事長包冉,在進(jìn)行深度測試后評價(jià):它解決了一個(gè)普遍性痛點(diǎn)——大模型生成內(nèi)容的一致性素材。
包冉表示:“迄今為止,Seedance2.0是我個(gè)人使用體驗(yàn)最好的一款素材。生成式人工智能的模型,它最大的問題就是一致性不夠好。提問某一個(gè)大模型的對話機(jī)器人,過一會(huì)兒再問,它給出的答案不一樣。我們有一個(gè)很形象的詞叫‘煉丹’,里面神奇的化學(xué)反應(yīng)你不知道它控制在哪一步。上一次按照工序,嚴(yán)絲合縫的執(zhí)行完,出來的結(jié)果和下一次遵循同樣流程、同樣步驟的操作,應(yīng)該得到一致的結(jié)果,這叫一致性?!?/p>
包冉認(rèn)為,只有解決了“一致性”,AI才能真正從玩具變成生產(chǎn)力工具,進(jìn)入嚴(yán)肅的影視工業(yè)流程素材。
包冉說:“如果每次結(jié)果都是聽天由命,靠運(yùn)氣去撞,那么就根本無法保證它質(zhì)量的穩(wěn)定性,如果僅僅把多模態(tài)的大模型作為一種娛樂工具,那無所謂,反正就圖個(gè)樂兒,無法把它當(dāng)做嚴(yán)肅的生產(chǎn)工具素材。所以說,Seedance2.0這個(gè)版本在一致性上取得了很好的突破?!?/p>
舉個(gè)例子,原本需要調(diào)試幾十個(gè)小時(shí)的電影特效,只需要幾行提示詞就能做到,再加上AI已經(jīng)很成熟的圖片、文字生成功能,影視行業(yè)的生產(chǎn)力會(huì)帶來極大提升,對于從業(yè)者,既是機(jī)遇,也是挑戰(zhàn)素材。
包冉進(jìn)一步說:“過去可能需要長時(shí)間訓(xùn)練,才能獲得的技能,現(xiàn)在通過AI工具賦能,只要有足夠創(chuàng)意和精準(zhǔn)表達(dá),就是提示詞,就能實(shí)現(xiàn)電影院線級(jí)的制作水準(zhǔn)素材。”
資深動(dòng)畫制片人鄭女士告訴中國之聲,包冉說的未來,已經(jīng)來到了現(xiàn)實(shí)工作中素材?,F(xiàn)在行業(yè)的全流程,從編劇到人物設(shè)計(jì)再到后期制作,都已經(jīng)用上了AI,但目前的AI工具仍不完美,AI經(jīng)常像是個(gè)“不聽話的畫師”。
鄭女士表示:“我們大概在前兩年就已經(jīng)開始用AI進(jìn)行一些美術(shù)了素材。但是,最開始的時(shí)候是要AI生成一部分,然后手改一部分,有時(shí)還要在當(dāng)時(shí)AI圖片大模型上找工程師來加一些插件,保證轉(zhuǎn)面、三視圖的一致性,否則AI直接生成可能會(huì)出現(xiàn)正臉與側(cè)臉不是同一人,或者耳朵位置、頭飾位置發(fā)生變化等情況?!?/p>
Seedance2.0有望解決目前AI生成視頻的一致性差的難題,鄭女士對此也表示認(rèn)同素材。她介紹,為了得到一個(gè)能用的鏡頭,創(chuàng)作者往往要耗費(fèi)大量時(shí)間去“抽卡”。
鄭女士說:“每一次讓它改,生成的視頻都不一樣素材。比如這次畫面A有問題,經(jīng)過它修改,A解決了,但畫面B又出現(xiàn)了問題,還得再改,非常費(fèi)勁。我覺得每次都像在進(jìn)行語文考試,天天在摳關(guān)鍵詞,特別累?!?/p>
像考語文一樣摳關(guān)鍵詞,這句無奈的調(diào)侃,道出了行業(yè)對工具“可控性”的渴望素材。而Seedance2.0這次之所以能引爆全網(wǎng),核心就在于它聽懂了“人話”,也看懂了“世界”。比如提出一套動(dòng)作,它就能精準(zhǔn)拷貝下來,這將大幅降低動(dòng)畫制作的專業(yè)門檻。動(dòng)畫制片人鄭女士在采訪中描繪了這樣一個(gè)未來:以前需要極高成本的特效大片,未來可能在小成本的工作室里就能誕生。Seedance2.0讓創(chuàng)作者可以跨過繁瑣的技術(shù)壁壘,直接比拼故事的內(nèi)核。
鄭女士表示:“那以后大廠的追光等效果不再可望不可即,它能讓我們在小成本的基礎(chǔ)上做出更好的效果素材。但現(xiàn)在就是要考驗(yàn)?zāi)愕谋硌莺凸适?,這永遠(yuǎn)是消費(fèi)者最關(guān)心的?!?/p>
隨著視頻生成技術(shù)逼近現(xiàn)實(shí)的邊界,“眼見為實(shí)”正在受到挑戰(zhàn),這給隱私保護(hù)和素材安全也提出新課題素材。針對公眾擔(dān)心的“深度偽造”問題,包冉強(qiáng)調(diào),技術(shù)在進(jìn)化,監(jiān)管體系也要隨之進(jìn)步。
“工具本身確實(shí)是中立的,但是,這種工具如果沒有相匹配的法律法規(guī)、安全底線相約束的話,極有可能造成相當(dāng)大的混亂素材。舉個(gè)例子,很多互聯(lián)網(wǎng)上的詐騙分子,他們之前就有過用深度偽造、深度合成的方式,合成某個(gè)男明星的頭像和語態(tài),對這些男明星的粉絲們進(jìn)行詐騙?!鞍竭@樣說。
面對挑戰(zhàn),包冉給出的藥方是“用技術(shù)治理技術(shù)”素材。監(jiān)管部門、法律法規(guī)和技術(shù)平臺(tái)必須形成合力。
包冉講道:“除了相關(guān)的法規(guī)之外,還有技術(shù)素材。因?yàn)樾枰谩Хā驍 ХāH绻煌ㄟ^技術(shù)手段進(jìn)行反制和制約,光靠人工審核,完全達(dá)不到技術(shù)生產(chǎn)的高效率,就被海量信息淹沒掉了?!?/p>