蘋果新AI論文:微調(diào)Qwen3-Coder,生成UI能力逆襲GPT-5

IT之家 2 月 6 日消息,科技媒體 9to5Mac 今天(2 月 6 日)發(fā)布博文,報道稱蘋果公示最新 AI 研究論文,利用生成式 AI 優(yōu)化 App 界面(UI)開發(fā),經(jīng)過特定方法微調(diào)的 Qwen3-Coder 模型,在 UI 生成能力上擊敗了 GPT-5論文。

IT之家援引博文介紹,該論文由蘋果 UICoder 團隊發(fā)表,主要是探索生成式 AI 如何更高效地融入 App 開發(fā)流程論文。

論文指出目前主流的“人類反饋強化學(xué)習(xí)”(RLHF)并不適合 UI 設(shè)計領(lǐng)域論文。傳統(tǒng)的 RLHF 通常要求人類對 AI 生成的結(jié)果進行簡單的“點贊 / 點踩”或排序。

然而,這種二元評價體系忽略了設(shè)計背后的復(fù)雜邏輯,也無法體現(xiàn)設(shè)計師的工作流論文。簡單來說,AI 只知道“這個不好”,卻不知道“哪里不好”或“怎么改才好”。

蘋果為了解決上述問題,招募了 21 位擁有 2 至 30 年經(jīng)驗的專業(yè)設(shè)計師參與實驗論文。不同于以往的打分模式,設(shè)計師需要直接通過撰寫評論、繪制草圖甚至直接修改代碼來優(yōu)化 AI 生成的界面。

蘋果新AI論文:微調(diào)Qwen3-Coder,生成UI能力逆襲GPT-5

團隊收集了 1460 條此類深度注釋,并將“修改前”與“修改后”的對比數(shù)據(jù)輸入到一個獎勵模型中論文。該模型通過學(xué)習(xí)截圖和自然語言描述,學(xué)會了像人類設(shè)計師一樣判斷 UI 的美觀度與功能性。

實驗數(shù)據(jù)顯示,基于“草圖反饋”訓(xùn)練的模型表現(xiàn)最為優(yōu)異論文。令人驚訝的是,僅依靠 181 個草圖注釋進行微調(diào),該模型就實現(xiàn)了對 GPT-5 的超越。研究團隊表示,這證明了“少而精”的專家級反饋能讓小參數(shù)模型在特定領(lǐng)域展現(xiàn)出超越大模型的潛力。

蘋果新AI論文:微調(diào)Qwen3-Coder,生成UI能力逆襲GPT-5

研究還揭示了一個關(guān)鍵現(xiàn)象:設(shè)計審美具有高度主觀性論文。在單純的排序任務(wù)中,研究人員與設(shè)計師的觀點一致率僅為 49.2%,幾乎等同于拋硬幣。

然而,當(dāng)設(shè)計師通過草圖或直接編輯來表達意圖后,雙方的一致率分別飆升至 63.6% 和 76.1%論文。這表明,在定義“什么是更好的設(shè)計”時,具體的視覺修改(Show)遠比抽象的評分(Tell)更具共識價值,這也是未來 AI 輔助設(shè)計工具進化的核心方向。

參考

本站內(nèi)容來自用戶投稿,如果侵犯了您的權(quán)利,請與我們聯(lián)系刪除。聯(lián)系郵箱:[email protected]

本文鏈接://m.cqlhyz.com/post/12023.html

?? /
欧美亚洲日韩国产综合每日更新,国产美女一级A作爱在线观看,亚洲欧洲国产1区二区,国产高清无码精油按摩