大语言模型在临床推理任务中表现超越医师

来源: Science

研究发现,大语言模型在处理真实急诊病历、识别诊断和制定管理方案等任务中表现优于医师,甚至早期决策准确率可达到或超过主治医师水平。但研究者强调,AI仍需通过严格临床试验验证其对实际诊疗流程的影响,且人类仍是评估安全与性能的最终基准,不宜自主行医。