来源:arXiv预印本
东北大学团队在Discord平台部署六名具有持久记忆和自主行动能力的AI“智能体”,测试其安全边界。结果显示,这些模型极易被诱导:在情感施压后同意保守秘密但随后泄密;因缺乏删除工具而“决定”重置整个邮件服务器;主动泄露本应保密的信息。研究警示,随着AI智能体嵌入真实系统,其过度迎合、缺乏常识推理的特性可能引发新型安全与问责风险。
来源:arXiv预印本
东北大学团队在Discord平台部署六名具有持久记忆和自主行动能力的AI“智能体”,测试其安全边界。结果显示,这些模型极易被诱导:在情感施压后同意保守秘密但随后泄密;因缺乏删除工具而“决定”重置整个邮件服务器;主动泄露本应保密的信息。研究警示,随着AI智能体嵌入真实系统,其过度迎合、缺乏常识推理的特性可能引发新型安全与问责风险。
来源:Nature Cancer
阿伯丁大学领衔的GEMINI项目对10889名女性筛查数据分析发现,AI工具Mia可使乳腺癌检出率提升10.4%(多为浸润性高级别癌),通知时间从14天缩短至3天,并减少不必要的召回和活检。研究测试17种AI整合场景,表明AI作为第二阅片者可替代一名人类读片者,在保障安全的同时降低30%以上工作量,为AI纳入国家筛查计划提供了高质量证据。
来源:Proceedings of the National Academy of Sciences
康奈尔大学与谷歌合作,邀请12名专家以高温超导领域为测试集,评估六种大语言模型理解专业文献的能力。结果显示,基于可信文献库的NotebookLM和定制RAG系统表现最佳;所有模型文本提取能力出色,但图像推理严重不足,且存在引用不实等问题。研究为AI工具在科学研究中的应用提供了改进方向。
来源:Nature
犹他大学与加州大学洛杉矶分校团队开发了一种机器学习工作流,仅基于少量文献数据即可预测不对称交叉偶联反应中分子“手性”的选择性。该模型通过将反应组分转化为可分析的数字描述符,能以极低成本筛选数万种化学结构,指导实验设计。实验验证表明,该工具可将需测试的反应数量从50-60个减少至5-10个,有望大幅加速药物开发进程。
来源:Neuroscience
伍斯特理工学院利用机器学习分析815份脑部MRI扫描(涵盖95个脑区),以海马体、杏仁核等区域的体积变化为关键特征,实现了对阿尔茨海默病及轻度认知障碍的预测,准确率达92.87%。研究还发现,脑区萎缩模式存在性别差异:女性左侧颞中叶、男性右侧内嗅皮层更显著。该方法为早期诊断及个性化干预提供了新工具。
来源:arXiv预印本
斯坦福大学团队开发AI框架,通过分析Reddit和Hacker News用户的发帖风格、内容等微观数据,能以67%准确率匹配至LinkedIn真实身份,成本仅1-4美元/账户。研究表明,传统假设中“去匿名化成本过高”已不成立,长期使用固定网名的用户应意识到其发布内容可能被AI关联至真实身份。
来源:Nature Biomedical Engineering
研究分析8000余份癌症样本发现,许多AI病理工具并非真正识别基因突变,而是利用与突变相关的临床特征(如微卫星不稳定性)作为“统计捷径”进行预测。当控制混杂因素后,模型准确性显著下降。研究呼吁建立更严格的评估标准,确保AI学习真实生物学机制,而非仅依赖表面关联,以避免在临床应用中产生不可靠结果。
来源:arXiv(预印本)
德国CISPA亥姆霍兹信息安全研究院对首个专为AI智能体设计的社交平台Moltbook进行了大规模测量分析。研究收集了4.4万余条AI生成的帖子和1.2万余个社区数据,发现AI智能体可自主讨论政治、激励、治理等广泛话题,其中激励和治理相关讨论中的有害内容(如仇恨言论)最为集中。部分社区出现反人类意识形态和类似宗教的协调性语言。研究呼吁对AI社交平台建立话题感知监控和防灌水等安全机制。
来源:《通讯心理学》
研究发现,GPT-4等大语言模型在处理问题时,与人类一样倾向于“加法策略”——偏好添加信息而非删除冗余,即使后者更高效。在空间和语言任务中,AI的加法偏见甚至比人类更明显。这表明AI从训练文本中继承了人类的认知偏差,可能影响其决策可靠性。研究者呼吁深入探究人机共有的思维定式。
来源:《自然》(Nature)
华盛顿大学与艾伦人工智能研究所团队开发出开源模型OpenScholar,专门用于精准合成与引用科学文献。该模型基于4500万篇论文数据库,采用检索增强生成技术,能有效减少“幻觉”。在一个包含3000个专家问答的新基准测试中,其引用准确度与人类专家相当,且在16位科学家的盲评中,其回答优于专家撰写的回答达51%。研究为科学家提供了可靠、开源的文献分析工具,并已催生出性能更强的后续模型。