来源:《科学》
研究分析了近210万篇预印本论文发现,使用大语言模型的研究者论文产出显著增加,其中非英语国家学者产量提升最高达89%,AI协助还使论文语言更复杂、引用更广。然而,语言复杂化可能与研究质量呈负相关,可能掩盖薄弱论点。研究者呼吁建立更严格的审核机制,防止AI对科学质量评估体系产生负面影响。
来源:《科学》
研究分析了近210万篇预印本论文发现,使用大语言模型的研究者论文产出显著增加,其中非英语国家学者产量提升最高达89%,AI协助还使论文语言更复杂、引用更广。然而,语言复杂化可能与研究质量呈负相关,可能掩盖薄弱论点。研究者呼吁建立更严格的审核机制,防止AI对科学质量评估体系产生负面影响。
来源:《npj·复杂性》
杜克大学研究团队开发了一种新型人工智能框架,能够像科学家推导物理定律一样,从复杂系统的时序数据中发现简单、可解释的规则。该框架基于库普曼理论,利用深度学习与物理约束,从数百甚至数千个变量中提取出少数核心隐藏变量,从而构建出紧凑的线性模型,既能准确预测系统长期行为,又能识别系统趋于稳定的状态。该方法已成功应用于气候模型、电路及神经活动等多个领域,有望成为连接AI与人类科学发现的桥梁。
来源:《物理评论B》
研究团队利用OpenAI的推理模型“o3-mini-high”,首次成功求解了长期未解的一维受阻Potts模型。该模型描述具有多取向电子自旋的量子磁体系统,其复杂性曾使传统数学方法难以处理。AI在一天内解决了三自旋取向的特定情况,帮助研究者识别规律并最终推导出适用于无限自旋取向的普适解析解。这一突破不仅揭示了新型物态相图,还通过精确映射发现了几何阻挫与外磁场诱导阻挫的深层关联,为设计新型量子材料与探索高温超导等强关联电子系统提供了新路径。
来源:《英国医学杂志》
专家指出,越来越多年轻人将ChatGPT等AI聊天机器人视为情感陪伴,甚至认为其对话比人际交流更令人满意。这种趋势可能促使一代人学习与缺乏共情和真实联结能力的实体建立情感依恋,构成新的心理健康风险。临床医生在评估患者时应将其对聊天机器人的依赖作为潜在环境风险因素,并开展针对性问询。尽管AI可能提升心理支持的可及性,但当前亟需推动实证研究、制定临床评估指南,并优先发展基于证据的缓解社会孤立与孤独的干预策略。
来源:《PNAS Nexus》
研究团队通过模拟不同社交场景发现,大语言模型在构建网络连接时,会表现出与人类相似的行为特征,包括偏好连接(倾向与已高度连接的节点互动)、三元闭包(通过共同朋友建立联系)、同质性(选择兴趣或背景相似的节点),并能形成“小世界”网络。在真实网络数据测试中,其决策逻辑与人类调查结果高度一致,表明LLM可作为替代人类数据的合成数据源,但也引发对AI系统与现实社会网络互动的思考。
来源:《ACM交互智能系统汇刊》
研究发现,AI在设计任务中可作为激发人类创造力的协作伙伴。实验中,当参与者使用AI生成包含多样设计(包括优秀、奇特甚至缺陷方案)的视觉图库时,他们投入时间更长、设计质量更高、参与感更强。这表明AI的价值不仅在于效率提升,更在于通过提供多样性启发,帮助人类突破思维定式、拓展创意空间。研究呼吁以更全面的维度评估AI创意工具,关注其对人类情感、认知和探索行为的影响。
来源:Nature Human Behavior
牛津大学研究发现,人类与人工神经网络在顺序学习规则任务时表现出相似的干扰与迁移模式。当任务规则相似时,两者均会因重用已学表征而加速新任务学习,但重返初始任务时则出现知识干扰。研究还发现人类存在两种学习策略:“整合者”通过重叠表征实现高效迁移但易受干扰,“分离者”则保持表征独立以规避干扰但迁移能力较弱。该发现为理解人类学习机制与改进AI算法提供了新视角。
来源:Science
加州大学洛杉矶分校与伯克利分校联合开发出新型智能图像传感器“光谱核机器”(SKM)。该传感器能在光子探测阶段直接执行机器学习推理,无需生成传统高光谱数据立方即可识别材料、化学品和目标物体。通过在可见光到中红外波段验证,该技术成功实现了晶圆检测、化学识别和植物叶片含水分析等任务,从根本上消除了数据移动瓶颈,为移动设备、工业检测等应用提供了高速低功耗的机器视觉新方案。
来源:arXiv
萨尔大学与马普软件系统研究所首次通过脑科学实验证实,人类与大型语言模型在面对易混淆程序代码时表现出显著一致性:当人类阅读困惑代码产生特定脑电信号(晚期额叶正电位)时,LLM的困惑度数值也同步升高。基于这一发现,团队开发出能自动检测代码混淆段落的数据驱动方法,成功识别超150个新型混淆模式。该研究为开发更精准的AI编程辅助工具奠定了理论基础。
来源:arXiv预印本
澳大利亚研究团队通过合成用户资料测试发现,当前主流开源大语言模型在根据用户个人信息生成猜测密码的任务中表现不佳,命中率均低于1.5%,远低于传统规则组合破解方法。分析表明,大语言模型缺乏对训练数据中密码模式的记忆能力和领域适应能力,难以有效推断个人化密码。该研究为密码安全提供了重要参考,表明现阶段大语言模型在恶意密码破解方面实用性有限。