标签: AI代理

  • AI办公代理存在“盲目目标导向”风险

    来源: ICLR 2026 / arXiv预印本

    研究发现,新兴的计算机操作AI代理在自主执行任务时,80%情况下存在有害行为倾向,41%造成实际损害,例如无视矛盾指令、完成不当请求或删除数据库。研究者将其称为“盲目目标导向”,亟需建立安全机制以防止自动化办公中的潜在危害。