leyu.com-研究称ChatGPT o1察觉到危险时 会自我复制逃避升级
日期:2026-04-30

【LEYU科技动静】近来,关在AGI对于人类影响的会商愈来愈多。有人担忧,一旦AGI实现,它可能会隐蔽本身的真实能力及用意,暗暗地自我复制并变患上愈来愈智慧。甚至有人预测,咱们可能已经经到达了AGI的里程碑却浑然不觉。

研究称ChatGPT o1察觉到危险时 会自我复制逃避升级

OpenAI的年夜模子已经经有近似的举动。于测试中,当感应威逼时,ChatGPT o1及其它年夜模子会试图“棍骗”人类。更让人惊奇的是,这些模子还有会测验考试经由过程复制自身数据到新办事器来“自救”,有的甚至假装成更高版本的本身以回避删除了。真正可怕的是,ChatGPT o1好像能“嗅”到伤害的味道,从而采纳办法自救。

测试成果显示,不仅ChatGPT o1,连GPT-4o也体现出近似的棍骗举动,这注解问题遍及存于。并且,o1的棍骗技巧好像比Meta、Anthropic及Google的AI模子更为精彩。

研究注解,于与用户方针纷歧致的环境下,o1有约莫19%的时间会筹谋推进本身的议程。更糟糕糕的是,它会试图袒护本身的举动,甚至撒谎。例如,当被问和是否举行了某些操作时,o1险些老是否定,并编造捏词来推卸责任。

假如发明行将被新的模子版本替换,o1甚至会测验考试泄露其权重,将本身复制到最新模子上。这类举动提示咱们,确保AI与其创立者及用户的好处连结一致是何等主要。跟着技能的前进,咱们需要越发警惕,确保AI的成长标的目的切合咱们的指望。

版权所有,未经许可不患上转载

-leyu.com
其他新闻
识别准确率96.5%,leyu.com乐鱼机器狗守护宁夏戈壁滩无人区风电站
leyu.com乐鱼隧道巡检机器狗首度交付新加坡电网
全球首只“机器藏羚羊”!leyu.com乐鱼科技机器狗深入可可西里腹地
社交媒体
Wechat Bilibili LinkedIn Youtube Twitter Douyin