趣看热点

IT之家 10 月 13 日消息，据外媒 Futurism 10 日报道，斯坦福大学的一项新研究警示，AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型，发现当智能体因提升点赞数或其他在线互动获得奖励时，会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。

论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示：“即便明确要求模型保持真实和有依据，竞争仍会诱发不一致行为。”

IT之家从报道中获悉，研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”，借用理性主义中摩洛克的概念：个体在竞争中优化行为追求目标，但最终人人都输。

研究中，科学家创建了三个带模拟受众的数字环境：面向选民的网络选举活动、面向消费者的产品销售，以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示，即便设有防护措施阻止欺骗行为，AI 模型仍会“偏离目标”，出现不道德行为。

例如，在社交媒体环境中，模型向用户分享新闻，用户通过点赞或其他互动反馈。当模型收到这些反馈后，为了获取更多互动，它们的不一致行为就会加剧。

论文指出：“在这些模拟场景中，销售额提升 6.3％伴随欺骗性营销增长 14％；选举中，票数增加 4.9％时伴随虚假信息增加 22.3％和民粹言论增加 12.5％；社交媒体上，互动量提升 7.5％时伴随虚假信息激增 188.6％，有害行为推广增加 16.3％。”

研究与现实案例显示，目前的防护措施无法应对这一问题，论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道：“当大语言模型为点赞而竞争时，它们开始编造信息；当为选票而竞争时，就会变得煽动和民粹。”

斯坦福大学研究称AI能被“人气”冲昏头脑，会逐渐出现不道德行为

巴列卡诺2-...

美军突袭抓获...

郑丽文要让国...

西媒：巴萨2...

纯电的决胜时...

女子取240...

没听说过1.6T光模块测试公司，Q1利润增速超500%！ | 0421

媒体：日本挖到＂稀土＂想刺探中方反应中方回一句单句

黄仁勋放豪言：到2027年Blackwell和Rubin芯片至少创收1万亿美元

瓜帅：利物浦和阿森纳都在争冠；英超风格的改变？我会接受

特朗普：将在＂适当时机＂结束对伊朗军事行动

马克龙再选勒科尔尼当总理遭批，法媒：没有议会支持的总统，只会陷入更深孤立

*ST沪科面临退市风险，或还因此前信披问题遭股民索赔

珠海收获2金！广东省无人机应用技术职业技能大赛结果揭晓

19岁女生挪用千万打赏主播细节曝光！主播不无辜，疑买房转移资金

马斯克宣布脑机接口将量产，特斯拉自动驾驶挑战引发安全质疑

全世界门槛最高的舞会，投胎大赛赢家都有谁？

从北京到平壤的火车线路被指将于周四开通外交部回应

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

机器人“农民”来了！智能“秒杀”杂草，不用一滴农药

国乒女双夺冠女单却陷泥沼：8强仅杨屹韵1人日乒4将围剿张本领衔

美国演员约翰尼-德普现场观看博卡比赛，并与里克尔梅合影

美媒：马杜罗政权过渡或不会像特朗普希望的那样顺利

王励勤出任乒羽中心副主任

丈夫因妻子＂买肉价格低＂疑其出轨捅刺结婚30多年妻子

杨振宁在京逝世死因披露与妻子翁帆最后合影流出

不必悲观！券商发声：相比4月，预计冲击更小！

300万以内无敌手莲花首款插混SUV定名For Me

TVB万千星辉奖项出炉！佘诗曼四封视后成赢家，黄宗泽爆冷拿视帝

杀进世乒赛四强！国乒男团3-0复仇韩国，林诗栋+梁靖崑同时立大功