来源:《BMJ Open》
研究测试了Gemini、DeepSeek、Meta AI、ChatGPT和Grok在癌症、疫苗等五类健康问题上的回答,发现50%的回复存在不同程度问题,其中20%高度有问题。聊天机器人常以肯定语气输出错误或不完整信息,参考文献质量差,可读性低。研究者呼吁加强公众教育与监管,防止AI加剧健康 misinformation。
来源:《BMJ Open》
研究测试了Gemini、DeepSeek、Meta AI、ChatGPT和Grok在癌症、疫苗等五类健康问题上的回答,发现50%的回复存在不同程度问题,其中20%高度有问题。聊天机器人常以肯定语气输出错误或不完整信息,参考文献质量差,可读性低。研究者呼吁加强公众教育与监管,防止AI加剧健康 misinformation。
来源: The Conversation
研究发现,AI已能通过自动化云实验室自主设计并运行数万项生物实验,大幅降低成本。但现行监管未能跟上其“双重用途”风险:AI可能被滥用于优化病毒传播、指导生物武器开发。尽管部分公司采取自愿安全措施,但政策空白仍存,需在防范风险与避免过度限制间取得平衡。
来源: arXiv(预印本)
罗格斯大学物理学家David Shih受魔方还原逻辑启发,开发出一种AI方法,可将粒子物理学中极其冗长的方程简化。该方法将方程简化视为“打乱与还原”过程,简化率接近完美,远超此前基于机器学习的方法。研究全程与AI系统Claude协作完成,展示了AI辅助科研的新范式。
来源:npj Cardiovascular Health
剑桥大学团队研发的AI系统,通过分析数字听诊器采集的心音数据,能准确识别严重心脏瓣膜病(主动脉瓣狭窄检出率达98%,二尖瓣反流达94%)。该算法性能超越全科医生,误报率低,可作为基层医疗的快速筛查工具,助力早期诊断、及时转诊,有望解决因人口老龄化加剧的医疗资源压力,降低瓣膜病未及时治疗导致的高死亡率风险。
来源:哈佛大学
为评估AI在数学研究中的真实能力,11位顶尖数学家发起“First Proof”挑战赛,公布了10个已解决但未公开的前沿问题,邀请AI尝试独立证明。初步测试显示,当前最佳AI模型仅能解答其中两题,且存在逻辑错误与虚构引用。数学家指出,AI擅长整合已知结果与算法性问题,但在提出原创问题、构建研究框架及实现概念飞跃方面,仍远未达到人类专家水平,所谓“AI替代数学家”的论调为时过早。
来源:《自然·生物医学工程》
密歇根大学团队开发出一款名为Prima的视觉语言模型,可基于脑部MRI与患者临床史快速诊断50余种神经疾病,准确率高达97.5%。该模型经超30万例MRI数据训练,能自动识别紧急病例(如脑出血、中风)并提示对应专科医生,有助于缓解影像科工作负荷与诊断延迟问题。研究团队称Prima如同“医学影像领域的ChatGPT”,未来有望扩展至乳腺X光、胸部X光等更多影像模态,成为提升医疗效率与可及性的创新工具。
来源:《自然》(Nature)
华盛顿大学与艾伦人工智能研究所团队开发出开源模型OpenScholar,专门用于精准合成与引用科学文献。该模型基于4500万篇论文数据库,采用检索增强生成技术,能有效减少“幻觉”。在一个包含3000个专家问答的新基准测试中,其引用准确度与人类专家相当,且在16位科学家的盲评中,其回答优于专家撰写的回答达51%。研究为科学家提供了可靠、开源的文献分析工具,并已催生出性能更强的后续模型。
来源:《自然》(Nature)
荷兰癌症研究所等团队通过结合大规模实验测量与深度学习,开发出轻量化AI模型PARM。该模型能够以前所未有的细节“阅读”非编码DNA中的调控指令,精准预测特定细胞类型(如肿瘤细胞)在不同刺激下(如药物处理)的基因开关状态。与现有大型模型相比,PARM计算需求降低千倍,使全球学者能便捷地解析癌症相关调控突变,为癌症诊断、患者分层及新疗法开发开辟了新途径。
来源:《The Conversation》
国际奥委会正积极在2026冬奥会等赛事中引入AI辅助评分系统,旨在提升评分一致性、透明度和公平性。然而,研究表明AI可能因过度精确、训练数据偏差而忽视艺术表现力与创新动作,甚至重塑运动的价值定义。同时,在行动体育等强调风格与风险的领域,AI难以量化文化内涵。因此,引入AI需在技术精度与体育精神、文化价值间取得平衡,避免技术侵蚀运动本质。
来源:《自然·计算科学》
麻省理工学院研究团队开发了一种名为DiffSyn的生成式AI模型,通过扩散算法学习超过2.3万种材料合成路径,可为特定目标材料(如沸石)推荐多种可行的合成方案,包括反应温度、时间与原料配比等。该模型能在1分钟内生成上千条合成路径,辅助科学家快速筛选。基于其建议,团队成功合成出一种具有更高热稳定性的新型沸石,突破了材料发现中合成实验的瓶颈。