首页 > 创作内容 > 创作内容 > 新研究发现部分人工智能系统已擅长“说谎

新研究发现部分人工智能系统已擅长“说谎

发布时间:2024-05-12 17:01:40

北京5月12日电 人工智能系统是否会欺骗人类,一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献,重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗,它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统,它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称,“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”,并且在玩游戏时“从不故意背刺”它的人类盟友,但该公司发表的论文数据显示,该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说,“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力,或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力,以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示,虽然人工智能系统在游戏中作弊似乎是无害的,但它可能会导致“欺骗性人工智能能力的突破”,并在未来演变成更高级的人工智能欺骗形式。

帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

创作内容更多>>

小米17系列全球发布会定档:2月28日巴塞罗那见 Gemini 3.1:小小小小更新压过对手大迭代,Google卷飞了 2026年2月小米17怎么选:一文看懂小米17系列的全部卖点 游戏一打开就让你小心癫痫 真的有必要吗? 特斯拉:xAI Grok将上线欧洲市场,率先在9国推出 印度、爱尔兰成为最新有意设置社交媒体年龄限制的国家 OpenAI有望拿到1000亿美元,但也快被逼到墙角了 消息称Meta重启智能手表项目,“Malibu 2”机型今年内发布 五菱星光560上市,燃油/插混/纯电可选,6万级拥有15万级享受 元UP冠军续航401km 7万级越级纯电SUV 上年销量21万辆,2026北京现代直指“智启2030计划” 深耕者胜,长期者赢,smart的长期主义如何驱动“确定性增长”? 首发天玑AIOS 6.0 ,2026小鹏新品发布会上市多款新车 为高原注入绿色动能:宇通重工三电技术破解高原寒区作业困局 2025年中国乘用车销量首破3000万辆,今年预计增幅0.5% 本田官宣换标 新LOGO 2027年全面启用 李斌新年首次内部讲话:成立“人工智能技术委员会”,加大投入推动AI全业务链落地 雷军强调:新一代SU7所有信息以工信部官网公告、正式发布会为准 全球首个机器人租赁平台“擎天租”完成种子轮融资 众擎CEO:我们的T800机器人体能超90%正常男人 西贝闭店约4000名员工或将失业 网友:罗永浩一句话影响这么大 上汽集团:2025年整车批发销量超450万辆 净利同比预增438%-558% AI在美国“与民争电”,核电成了硅谷“全村的希望” 16亿只是保底,马斯克想给朱晓彤的是100亿 花旗:预计人民币兑美元在未来6-12个月内将升向6.8 片酬倍增、代言不断,2025短剧演员能年入千万?丨年终策划 2026,房地产罕见“猛药”来了! 机构:2025年北京甲级写字楼净吸纳33万平米,中关村占半数 2025年房企销售额排位赛出炉:前十门槛卡线千亿,谁进谁退? 新年楼市积极开局:北京新政效果初显,深圳元旦假期二手房签约量同比涨四成