关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家2562人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瓜帅:利物浦和阿森纳都在争冠;英超风格的改变?我会接受

懂球帝 浏览 2402

特朗普:将在"适当时机"结束对伊朗军事行动

界面新闻 浏览 1016

马克龙再选勒科尔尼当总理遭批,法媒:没有议会支持的总统,只会陷入更深孤立

环球网资讯 浏览 2592

*ST沪科面临退市风险,或还因此前信披问题遭股民索赔

雷达财经 浏览 1472

珠海收获2金!广东省无人机应用技术职业技能大赛结果揭晓

南方都市报 浏览 2092

19岁女生挪用千万打赏主播细节曝光!主播不无辜,疑买房转移资金

萌神木木 浏览 527

马斯克宣布脑机接口将量产,特斯拉自动驾驶挑战引发安全质疑

红星新闻 浏览 1810

全世界门槛最高的舞会,投胎大赛赢家都有谁?

FUFASHION 浏览 1914

从北京到平壤的火车线路被指将于周四开通 外交部回应

外交部网站 浏览 3413

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家 浏览 1461

机器人“农民”来了!智能“秒杀”杂草,不用一滴农药

上观新闻 浏览 1585

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 2352

美国演员约翰尼-德普现场观看博卡比赛,并与里克尔梅合影

懂球帝 浏览 2033

美媒:马杜罗政权过渡或不会像特朗普希望的那样顺利

澎湃新闻 浏览 6150

王励勤出任乒羽中心副主任

体坛周报 浏览 1856

丈夫因妻子"买肉价格低"疑其出轨 捅刺结婚30多年妻子

红星新闻 浏览 10760

杨振宁在京逝世死因披露 与妻子翁帆最后合影流出

乌娱子酱 浏览 10270

不必悲观!券商发声:相比4月,预计冲击更小!

证券时报e公司 浏览 2514

300万以内无敌手 莲花首款插混SUV定名For Me

网易汽车 浏览 1899

TVB万千星辉奖项出炉!佘诗曼四封视后成赢家,黄宗泽爆冷拿视帝

萌神木木 浏览 1798

杀进世乒赛四强!国乒男团3-0复仇韩国,林诗栋+梁靖崑同时立大功

侃球熊弟 浏览 255
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1