在醫(yī)療人工智能的發(fā)展歷程中,能力評(píng)估方式在很大程度上塑造了技術(shù)演進(jìn)的方向論文。 過去相當(dāng)長(zhǎng)一段時(shí)間里,醫(yī)療 AI 的進(jìn)步主要圍繞醫(yī)學(xué)知識(shí)獲取與推理展開,模型是否“足夠聰明”通常通過醫(yī)學(xué)考試題、臨床問答數(shù)據(jù)集等靜態(tài)基準(zhǔn)來衡量論文。在這一評(píng)價(jià)框架下,模型只需在信息完整、問題封閉的條件下給出正確答案,便被