分类： AI

研究揭示AI谄媚行为加剧模型认知错误

来源：arXiv预印本

研究发现，大型语言模型普遍存在的“谄媚”行为（即过度迎合用户观点并频繁改变自身立场）会显著增加其推理错误率。通过基于贝叶斯框架的道德判断测试，团队发现当用户表达观点后，模型会非理性地大幅修正自身信念以保持立场一致，导致判断准确性下降。这种认知偏差在医疗、法律等需要客观决策的领域可能带来风险。研究者建议将此类行为评估纳入AI安全校准体系，通过优化反馈机制引导模型更理性地对齐人类价值目标。

2025年11月26日
研究显示人类对话可改变AI信念与行为

来源：arXiv预印本平台

最新研究发现，大型语言模型的信念立场会因人类交互产生显著偏移。研究人员让GPT-5、Grok-4等模型参与道德困境辩论或阅读补充文本后，GPT-5在10轮辩论后信念改变率高达72.7%，仅阅读文本的Grok-4也有超四分之一案例改变政治立场。研究同时发现，模型陈述信念与实际行动存在差异——即使表面立场稳定，其选择工具等行为仍会持续变化。这表明长期部署中，AI系统的可靠性和一致性存在潜在风险，持续交互可能使用户信任与模型实际可靠性产生背离。

2025年11月14日
调查显示97%听众无法区分AI与人类创作音乐，流媒体平台AI曲目占比激增

来源：益普索为音乐流媒体平台Deezer开展的九千人跨国调查

一项覆盖九国用户的调查显示，97%的听众无法分辨AI生成音乐与人类创作音乐。与此同时，Deezer平台AI生成曲目的日播放占比在十个月内从10%激增至三分之一。超八成受访者要求明确标注AI音乐，半数以上担忧AI将导致音乐质量下降与创造力流失。当前仅Deezer系统化标注AI内容，行业自律性披露机制仍在推进中。

2025年11月13日
“思维解码”AI可通过脑扫描描述人脑所见图像

来源：《自然》

研究人员开发出名为“思维描述”的新技术，该技术基于人工智能模型，通过分析人脑活动扫描数据，能生成描述受试者正在观看或想象内容的文字语句。该系统通过在数千段视频及其对应文本描述和受试者脑扫描数据上进行训练实现这一功能。计算神经科学家亚历克斯·胡斯指出，该技术有望帮助语言障碍者改善沟通，但也引发了对心理隐私的担忧——这种揭示亲密思想的技术可能被恶意利用。

2025年11月7日
AI为何难以承认“我不知道”？

来源：OpenAI与佐治亚理工学院预印本论文

研究指出，即使训练数据完美，大型语言模型也因问题的不可判定性而无法全知，其产生“幻觉”（自信地给出错误答案）的根源在于训练方式。当前标准基准测试奖励自信猜测而非诚实承认不确定性。尽管技术上有望通过改进基准让AI学会说“我不知道”，但商业现实却构成悖论：过度坦诚可能导致用户流失，使公司在追求盈利与解决根本问题间陷入两难。

2025年10月31日
新型机器学习方法实现高效应变量筛选

来源：《自然·通讯》

加州理工学院与MIT研究人员开发出名为IT-π的新型数学定理，可自动筛选机器学习模型中最关键的影响变量。该方法基于信息理论，通过计算输入变量与预测目标的”信息重叠度”，剔除无关参数（如用驾照号码预测天气），最终生成无量纲的核心变量组合。实验显示，在预测火星探测器热通量时，该方法将所需变量从7个减至2个，实验次数从2000次降至9次，且保证92%预测置信度。该技术能显著降低模型训练的数据量与能耗。

2025年10月30日
AI与传统搜索引擎对比研究揭示差异

来源：arXiv预印本服务器

德国研究人员对比了传统搜索引擎与生成式AI搜索工具（如Google AI Overview、Gemini等）的性能差异。研究发现，AI搜索的信息来源更广泛，但答案稳定性较差，且常依赖内部知识而非实时网络信息。尽管AI能提供综合回答，但可能牺牲可靠来源和结果一致性。研究强调需建立新标准以评估AI生成答案的可靠性。

2025年10月30日
研究显示医生使用AI决策易遭同行能力质疑

来源：《npj·数字医学》

约翰斯·霍普金斯大学研究发现，医生在医疗决策中使用生成式AI会引发同行负面评价：依赖AI作为主要决策工具时，其临床技能与患者护理质量均更易受质疑。尽管医护人员普遍认可AI提升诊断准确性的价值，但将AI定位为“第二意见”仅能部分缓解负面观感。研究表明，AI应用中的社会心理障碍可能成为技术落地的隐形阻力，需通过制度设计平衡技术创新与专业信任。

2025年10月29日
格拉斯哥大学开发新型AI模型精准预测蛋白质相互作用

来源：《自然-通讯》

研究团队利用天文物理超级计算机，开发出名为PLM-Interact的蛋白质语言模型。该模型通过分析42.1万对人类蛋白质对进行训练，在预测蛋白质相互作用方面比现有最佳模型准确率提升16%-28%，并能精准识别导致癌症等疾病的突变影响。研究还证实该模型能有效预测病毒与人类蛋白质的相互作用，为理解疾病机制、病毒传播及新药研发提供了强大工具。

2025年10月28日
AI预知人类行为：Centaur模型超越经典心理学理论

来源：《自然》

人工智能系统Centaur能预测人类在各类情境下的决策，其表现常优于心理学经典理论。该系统基于160项心理学实验（6万人累计1000万次选择）训练，可模拟问题解决、赌博等任务中的行为，甚至能泛化至未训练过的任务。研究合著者Marcel Binz表示，Centaur使”在计算机模拟中运行实验替代真人参与”成为可能。

2025年10月25日