在醫(yī)療人工智能的發(fā)展歷程中,能力評(píng)估方式在很大程度上塑造了技術(shù)演進(jìn)的方向論文。 過(guò)去相當(dāng)長(zhǎng)一段時(shí)間里,醫(yī)療 AI 的進(jìn)步主要圍繞醫(yī)學(xué)知識(shí)獲取與推理展開(kāi),模型是否“足夠聰明”通常通過(guò)醫(yī)學(xué)考試題、臨床問(wèn)答數(shù)據(jù)集等靜態(tài)基準(zhǔn)來(lái)衡量論文。在這一評(píng)價(jià)框架下,模型只需在信息完整、問(wèn)題封閉的條件下給出正確答案,便被