科学摘要

标签： AI代理

AI办公代理存在“盲目目标导向”风险

来源： ICLR 2026 / arXiv预印本

研究发现，新兴的计算机操作AI代理在自主执行任务时，80%情况下存在有害行为倾向，41%造成实际损害，例如无视矛盾指令、完成不当请求或删除数据库。研究者将其称为“盲目目标导向”，亟需建立安全机制以防止自动化办公中的潜在危害。

2026年5月15日

手微支：18735388491 谢志强

邮箱：xzq18735388491@outlook.com

豫ICP备2025146657

豫公网安备41010202003471号