新研究发现部分人工智能系统已擅长“说谎”

版次:A02  2024年05月13日

淮南日报社严正声明


长期以来,淮南市部分自媒体、政务新媒体未经淮南日报社授权同意,肆意、擅自、无偿转载、链接、转贴或以其他方式复制、录制发表淮南日报社(含淮南日报、淮河早报、淮南网以及淮南日报官方微博、微信、抖音、视频号、掌上淮南新闻客户端等平台)记者采写的新闻稿件,特别是部分自媒体、政务新媒体不注明稿件来源、原创作者(或者采取隐匿、模糊形式处理稿件来源、原创作者),肆意、擅自删节、修改淮南日报社记者原创新闻稿件,严重违背新闻职业准则和道德,严重侵害淮南日报社版权,严重损害淮南日报社新闻记者权益。

现声明如下:

凡淮南日报社记者署名的文字、图片以及短视频等新媒体形态作品和融新闻作品,版权均属淮南日报社所有。未经授权,任何媒体、网站,不得转载、链接、转贴或以其他方式复制发表,各类自媒体和各级政务新媒体不得转载、链接、转贴或以其他方式复制发表。已经授权的媒体、网站,在使用时必须在醒目处以醒目和规范方式注明来源、作者。违者,淮南日报社将依法追究法律责任。

新华社北京5月12日电 人工智能系统是否会欺骗人类,一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献,重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗,它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统,它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称,“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”,并且在玩游戏时“从不故意背刺”它的人类盟友,但该公司发表的论文数据显示,该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说,“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力,或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力,以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示,虽然人工智能系统在游戏中作弊似乎是无害的,但它可能会导致“欺骗性人工智能能力的突破”,并在未来演变成更高级的人工智能欺骗形式。

帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”