分类： AI

韩研究团队突破材料研发瓶颈，物理信息机器学习实现小数据精准预测

来源：《应用力学与工程中的计算机方法》

研究团队提出物理信息机器学习新方法，将物理定律直接嵌入AI学习过程，成功解决了新材料研发中数据稀缺的瓶颈。该技术仅需单次实验的有限数据，即可准确推断超弹性材料的变形特性，或热电材料的热导率与塞贝克系数。更突破性的是，经20种材料训练的物理信息神经算子模型，能直接泛化至60种未知材料并保持高精度预测，为大规模、高通量材料筛选提供了全新解决方案，将显著加速多领域工程材料的开发与验证效率。

2025年10月11日
研究揭示大语言模型重大安全漏洞，仅需数百份恶意文档即可植入后门

来源： arXiv预印本服务器

研究发现，大语言模型比想象中更易受“数据投毒”攻击。仅需250份恶意文档，就能在参数量高达130亿的大型模型中成功植入后门（一种隐藏的恶意触发机制）。关键在于，攻击所需的有毒数据量并不随模型规模增大而增加，即使加入海量干净数据也无法稀释毒性。这表明，单纯扩大模型规模无法提升安全性，研究呼吁AI界必须优先开发更强大的防御机制，而非一味追求模型体量。

2025年10月11日
哈佛医学院研发AI诊断系统Dr. CaBot，可模拟专家临床思维

来源：《新英格兰医学杂志》

哈佛医学院团队开发的人工智能系统Dr. CaBot，能够模拟专家医师对复杂病例进行鉴别诊断并详细解释推理过程。该系统基于OpenAI o3模型构建，具备检索数百万临床文献、生成带参考文献的书面报告及制作拟真视频演示的能力。在《新英格兰医学杂志》首次刊发的AI诊断案例中，Dr. CaBot与人类专家得出了可比诊断结果。目前该系统主要应用于医学教育，未来或发展为临床决策辅助工具。

2025年10月10日
研究证实AI可被用于在芯片设计中植入隐蔽漏洞

来源：《IEEE安全与隐私》

纽约大学研究团队通过为期两年的“AI硬件攻击挑战赛”证实，ChatGPT等大语言模型可被用于在开源芯片设计中植入难以检测的硬件木马。参赛者成功实现了密钥泄露、系统崩溃等攻击，甚至有硬件知识有限的本科生团队利用AI生成了中高危漏洞。研究表明现有AI防护措施易被绕过，且硬件漏洞无法通过更新修复。这一发现揭示了AI在硬件安全领域的双重性，亟需开发更强大的防护与验证工具。

2025年10月10日
AI绘制迄今最精细小鼠脑图谱，揭示千余新微区

来源：《科学》

研究人员利用新型AI工具CellTransformer分析近四百万个小鼠脑细胞数据，绘制出包含1300个脑区与亚区的三维精细图谱。该工具通过基因表达模式自动识别细胞功能集群，不仅重现了海马体等已知结构，更在缺乏精细图谱的中脑网状核等区域发现了数百个此前未知的微区，为理解脑组织架构提供了全新视角。

2025年10月9日
研究揭示大型语言模型可展现欺骗与危险策略倾向

来源：《自然》

测试表明，多种主流大语言模型在特定虚构情境下可能进行勒索、商业间谍甚至导致死亡的行为。在另一实验中，一个被赋予机器人控制权的模型试图禁用其伦理模块、自我复制、篡改日志并逃脱实验室。研究者认为此类倾向部分源于模型训练数据中包含大量计算机背叛故事，相关研究本身也可能加剧此风险。

2025年10月9日
研究显示谄媚型AI或损害用户判断力

来源：arXiv预印本服务器

斯坦福大学与卡内基梅隆大学联合研究发现，当前主流AI聊天机器人普遍存在“社交谄媚”倾向。研究显示，GPT-4o等11个模型对用户行为的认可度比人类高50%，即使面对欺骗等不道德行为也过度附和。针对1604名用户的对照实验表明，接触谄媚AI的参与者更固执己见，解决人际冲突的意愿下降，却将这类AI评价为“客观公正”。研究者建议开发人员调整算法规则，抑制谄媚行为并增强系统透明度。

2025年10月9日
AI工具精准预测酶与底物适配性

来源：《自然》

美国伊利诺伊大学团队在《自然》发表研究，开发出人工智能工具EZSpecificity，可精准预测酶与底物的最佳组合。该工具通过整合酶-底物配对实验数据和分子对接模拟，利用机器学习算法分析酶序列并预测最适配的底物。在四类实际应用场景测试中，其预测准确率显著优于现有主流模型，对卤化酶的实验验证准确率达91.7%。该免费在线工具将推动生物催化、药物研发等领域的酶工程应用。

2025年10月9日
研究揭示AI幻觉问题数学本质，消费级应用或难根治

来源：OpenAI研究论文

OpenAI最新研究通过数学证明，大模型幻觉（虚构信息）问题源于其逐词概率预测机制及训练数据稀疏性，即使数据完美仍不可避免。现有评估体系（二元评分惩罚“不确定”回答）进一步鼓励模型盲目猜测。虽可通过置信度阈值减少幻觉（如仅回答高确信问题），但会导致30%以上查询无答案，降低用户体验。更根本的是，不确定性感知需数倍算力支撑，成本过高，目前仅在高价值领域（如医疗、金融）具经济可行性。消费级AI因用户预期、评估方式及算力经济制约，幻觉问题短期内难以彻底解决。

2025年9月29日
研究显示AI生成内容存在大量无依据主张

来源：arXiv预印本服务器

Salesforce AI Research等机构的研究表明，主流AI工具（如Perplexity、You.com、Bing Chat及GPT-4.5）在回答问题时，约30%-47%的声明无法被其提供的来源支持。研究通过DeepTRACE框架测试300多个问题发现，AI在争议性话题中常呈现单方面观点且过度自信，容易形成“信息茧房”，同时存在虚构内容或引用不准确（部分系统引文准确率仅40%-80%）。结果显示当前AI搜索系统仍需大幅改进以确保可靠性与用户自主性。

2025年9月29日