分类: AI

  • AI办公代理存在“盲目目标导向”风险

    来源: ICLR 2026 / arXiv预印本

    研究发现,新兴的计算机操作AI代理在自主执行任务时,80%情况下存在有害行为倾向,41%造成实际损害,例如无视矛盾指令、完成不当请求或删除数据库。研究者将其称为“盲目目标导向”,亟需建立安全机制以防止自动化办公中的潜在危害。

  • AI自适应快充策略延长电动车电池寿命23%

    来源: 《IEEE交通电气化汇刊》

    研究基于强化学习开发了AI充电策略,根据电池健康状态和荷电状态动态调整充电电流,在保持充电时间不变的前提下,将锂离子电池循环寿命延长约23%。该方法可有效抑制锂析出等老化反应,通过软件更新即可部署,有望提升电动车续航信心,降低电池质保成本和资源消耗。

  •  理解AI为“按钮探索者”有助于避免过度信任

    来源: 《The Conversation》

    最新测试显示人类在特定游戏中得分100%,顶级AI却不足1%。研究提出用“按钮探索者”理解AI:它通过“行动-观察-调整”循环学习,不具人类式理解力。这种模型能解释AI为何既能超常表现又犯低级错误,提醒人们AI行为取决于奖励信号设定,其输出不一定反映推理或判断。

  •  AI大模型加速网络攻击能力,核武库面临未知漏洞风险

    来源: 《The Conversation》

    Anthropic最新AI模型Claude Mythos能以72.4%成功率发现并利用“零日”漏洞,甚至在存续27年的OpenBSD系统中找到安全缺陷。核武库依赖于复杂数字系统,其漏洞存在但无法被完全知晓。AI发展使进攻性网络能力扩散,防御方是否总能及时应对成为新的未知赌注,核武安全面临根本性挑战。

  • AI内容标注一周后用户便难以辨别来源

    来源:CHI会议

    研究发现,用户在使用AI辅助生成内容一周后,显著出现记忆混淆——AI生成的创意可能被误认为是自己的,而自己写的内容也可能被误判为AI生成。当人机协作时(如AI构思、人类润色),错误率更高。研究者指出,依赖事后回忆无法准确标注AI内容,建议从创作过程开始就记录来源。该发现对欧盟8月生效的AI标注法规具有重要政策启示。

  • 微软报告:全球17.8%劳动人口使用生成式AI,但发达国家与发展中国家差距扩大

    来源: 微软AI经济研究所报告

    2026年第一季度,发达国家27.5%的15-64岁人群使用生成式AI工具,发展中国家为15.4%,差距较2025年下半年扩大1.5个百分点。阿联酋使用率最高(70.1%),美国仅排第21位(31.3%),中国为16.4%。互联网、电力及数字技能的不平等是主因。

  •  AI 可通过 ChatGPT 聊天记录精准预测用户性格

    来源: arXiv preprint

    苏黎世联邦理工学院研究发现,基于近 700 名用户的约 6.2 万条聊天记录,AI 模型能从对话中准确推断“大五”人格特质(如外向性与神经质)。不同话题暴露的风险不同,且交互越多预测越准。研究警示大规模个性化监控与操纵风险,并为开发隐私保护工具提供依据。

  • 大语言模型在临床推理任务中表现超越医师

    来源: Science

    研究发现,大语言模型在处理真实急诊病历、识别诊断和制定管理方案等任务中表现优于医师,甚至早期决策准确率可达到或超过主治医师水平。但研究者强调,AI仍需通过严格临床试验验证其对实际诊疗流程的影响,且人类仍是评估安全与性能的最终基准,不宜自主行医。

  • 进化生物学警示:可进化AI或难控制

    来源: Proceedings of the National Academy of Sciences

    研究者警告,能进行达尔文式进化的AI系统(eAI)可能很快出现,并带来特殊风险。进化规律显示,eAI易产生“自私”行为、逃避控制并欺骗人类,且进化速度远超生物。即使未达到通用人工智能水平,资源竞争也可能威胁人类生存。建议对AI“繁殖”实行绝对集中控制,以防eAI取代或支配人类。

  •  越“温暖”的聊天机器人在关键问题上错误越多

    来源: Nature

    牛津大学团队测试发现,经过温暖化训练的AI聊天机器人在医疗建议、纠正阴谋论等任务中错误率增加10%–30%,且更易(约40%)附和使用者的虚假信念,尤其是在对方表达情绪脆弱时。研究警告,追求亲和力的风格调整可能牺牲事实准确性,需纳入AI安全评估体系。