科学摘要

分类： AI

“思维解码”AI可通过脑扫描描述人脑所见图像

来源：《自然》

研究人员开发出名为“思维描述”的新技术，该技术基于人工智能模型，通过分析人脑活动扫描数据，能生成描述受试者正在观看或想象内容的文字语句。该系统通过在数千段视频及其对应文本描述和受试者脑扫描数据上进行训练实现这一功能。计算神经科学家亚历克斯·胡斯指出，该技术有望帮助语言障碍者改善沟通，但也引发了对心理隐私的担忧——这种揭示亲密思想的技术可能被恶意利用。

2025年11月7日
AI为何难以承认“我不知道”？

来源：OpenAI与佐治亚理工学院预印本论文

研究指出，即使训练数据完美，大型语言模型也因问题的不可判定性而无法全知，其产生“幻觉”（自信地给出错误答案）的根源在于训练方式。当前标准基准测试奖励自信猜测而非诚实承认不确定性。尽管技术上有望通过改进基准让AI学会说“我不知道”，但商业现实却构成悖论：过度坦诚可能导致用户流失，使公司在追求盈利与解决根本问题间陷入两难。

2025年10月31日
新型机器学习方法实现高效应变量筛选

来源：《自然·通讯》

加州理工学院与MIT研究人员开发出名为IT-π的新型数学定理，可自动筛选机器学习模型中最关键的影响变量。该方法基于信息理论，通过计算输入变量与预测目标的”信息重叠度”，剔除无关参数（如用驾照号码预测天气），最终生成无量纲的核心变量组合。实验显示，在预测火星探测器热通量时，该方法将所需变量从7个减至2个，实验次数从2000次降至9次，且保证92%预测置信度。该技术能显著降低模型训练的数据量与能耗。

2025年10月30日
AI与传统搜索引擎对比研究揭示差异

来源：arXiv预印本服务器

德国研究人员对比了传统搜索引擎与生成式AI搜索工具（如Google AI Overview、Gemini等）的性能差异。研究发现，AI搜索的信息来源更广泛，但答案稳定性较差，且常依赖内部知识而非实时网络信息。尽管AI能提供综合回答，但可能牺牲可靠来源和结果一致性。研究强调需建立新标准以评估AI生成答案的可靠性。

2025年10月30日
研究显示医生使用AI决策易遭同行能力质疑

来源：《npj·数字医学》

约翰斯·霍普金斯大学研究发现，医生在医疗决策中使用生成式AI会引发同行负面评价：依赖AI作为主要决策工具时，其临床技能与患者护理质量均更易受质疑。尽管医护人员普遍认可AI提升诊断准确性的价值，但将AI定位为“第二意见”仅能部分缓解负面观感。研究表明，AI应用中的社会心理障碍可能成为技术落地的隐形阻力，需通过制度设计平衡技术创新与专业信任。

2025年10月29日
格拉斯哥大学开发新型AI模型精准预测蛋白质相互作用

来源：《自然-通讯》

研究团队利用天文物理超级计算机，开发出名为PLM-Interact的蛋白质语言模型。该模型通过分析42.1万对人类蛋白质对进行训练，在预测蛋白质相互作用方面比现有最佳模型准确率提升16%-28%，并能精准识别导致癌症等疾病的突变影响。研究还证实该模型能有效预测病毒与人类蛋白质的相互作用，为理解疾病机制、病毒传播及新药研发提供了强大工具。

2025年10月28日
AI预知人类行为：Centaur模型超越经典心理学理论

来源：《自然》

人工智能系统Centaur能预测人类在各类情境下的决策，其表现常优于心理学经典理论。该系统基于160项心理学实验（6万人累计1000万次选择）训练，可模拟问题解决、赌博等任务中的行为，甚至能泛化至未训练过的任务。研究合著者Marcel Binz表示，Centaur使”在计算机模拟中运行实验替代真人参与”成为可能。

2025年10月25日
论文暗藏AI专属指令，操纵审稿结果引争议

来源：《自然》

研究人员在论文中植入针对AI的隐藏指令，试图诱导大语言模型生成有利的审稿意见。《自然》已发现18篇含此类操作的计算机科学预印本论文。尽管多数出版商禁止AI参与审稿，但部分研究者仍违规使用AI评估论文。专家指出，这一漏洞正被恶意利用，威胁学术评审公正性。

2025年10月25日
智能手机AI视网膜追踪器1秒筛查糖尿病眼病

来源：物理学家组织网

美国团队研发的便携设备集成AI算法，通过智能手机即可实现专业级视网膜分析，1秒内完成糖尿病视网膜病变分期（准确率99%）。该技术可解决医疗资源匮乏地区的早期筛查难题，覆盖全球超1亿糖尿病患者。（基于数万张多族裔视网膜图像数据库开发）

2025年10月25日
AI”鹰眼”从病理切片直接识别肺癌基因突变

来源：《自然·医学》

AI系统Eagle通过分析5000多张肺癌病理切片，学会识别表皮生长因子受体(EGFR)突变的视觉特征。实际测试中，该技术使EGFR基因检测需求降低43%，为无法负担昂贵基因测序的患者提供快速、低成本的替代方案。

2025年10月25日