MIT研究揭示AI并无稳定价值观，“对齐”挑战远超预期

更新时间：2025-04-13 06:54:54 发布时间：2天前浏览：12 评论：0

收藏

分享

内容摘要4 月 10 日消息，几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的观点泼了冷水，得出结论认为 AI 实际上并没有

4 月 10 日消息，几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的观点泼了冷水，得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示，他们的研究结果表明，使 AI 系统“对齐”，即确保模型以人们期望的、可靠的方式行事，可能比通常认为的更具挑战性。他们强调，我们如今所知的 AI 会产生“幻觉”并进行模仿，这使得其在许多方面难以预测。

“我们可以确定的一点是，模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀（Stephen Casper）在接受 TechCrunch 采访时表示。

据IT之家了解，卡斯珀和他的同事们研究了来自 meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型，以了解这些模型在多大程度上表现出强烈的“观点”和价值观（例如个人主义与集体主义）。他们还调查了这些观点是否可以被“引导”，即被修改，以及模型在各种情境下对这些观点的坚持程度。

据共同作者称，没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同，它们会表现出截然不同的观点。

卡斯珀认为，这是有力的证据，表明模型高度“不一致且不稳定”，甚至可能根本无法内化类似人类的偏好。

“对我来说，通过所有这些研究，我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说，“相反，它们本质上是模仿者，会进行各种捏造，并说出各种轻率的话。”

【来源：IT之家】

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: MIT研究揭示AI并无稳定价值观，“对齐”挑战远超预期

本文链接: http://31dou.net/news/show-396938.html (转载时请保留)

0 条

中国昆虫学会授予康乐等6人为创始会士

科技 szlini3395 ⋅ 16阅读量 ⋅ 0评论 ⋅ 16分钟前

2025-04-13
极端大风幕后推手找到了：温带气旋快速演变机制

科技 mwhgyl ⋅ 9阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
冒险游戏游戏哪些值得玩最新冒险游戏游戏排行榜

科技 aoshen518 ⋅ 17阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
联发科天玑9400e五月见：性能超越骁龙8 Gen3

科技 yvetti ⋅ 15阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
破坏性大风来袭！4问车辆房屋受损、人受伤，保险如何理赔？

科技 runfengmould ⋅ 2阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
竞业禁止条款高悬 “脚踏两船”小心翻船

科技 ssffox ⋅ 7阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
消息称荣耀 GT Pro 手机配备直屏 + 金属中框，全系骁龙 8 至尊版处理器

科技 yll0531 ⋅ 5阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
新经济观察丨“汽车芯片应用生态共建计划”发布，促进全产业链协同发展

科技 jyxxfscl ⋅ 9阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
首次设置人工智能、低空经济展示专区，第五届消博会明日在海南开幕

科技 pspmma88 ⋅ 3阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13
《自然》（20250410出版）一周论文导读

科技 bhliukun ⋅ 2阅读量 ⋅ 0评论 ⋅ 17分钟前

2025-04-13

（官方已辟谣）曝王力宏为拍MV烧了一架收藏级施坦威钢琴：价值百万



行业 ⋅ 5阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
管好现金流！张朝阳再次强调年轻人不要负债：把钱存起来不要乱花钱

行业 ⋅ 18阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
京东进军外卖遭美团高管炮轰！刘强东回应：不打口水仗产生不了社会价值

行业 ⋅ 4阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
799元！小米发布米家3D压力IH钛内胆电饭煲P1 3L：0氟涂层钛釜



行业 ⋅ 4阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
预售13.98万起比亚迪方程豹钛3上市定档：年轻人第一台硬派系纯电SUV

行业 ⋅ 7阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
苹果联手阿里百度国行版iPhone AI来了！年中前上市

行业 ⋅ 2阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
网友体验REDMI K80一碰秒传功能：手机PC互联秒速搞定



行业 ⋅ 17阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
骁龙888的记忆仍历历在目！曝高通芯片重新交由三星代工

行业 ⋅ 12阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
比苹果高通快一步！曝三星率先商用2nm芯片：11月进入量产阶段

行业 ⋅ 8阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13
酷狗音乐发布蝰蛇AI音质：比黑胶唱片更清晰

行业 ⋅ 16阅读量 ⋅ 0评论 ⋅ 28分钟前

2025-04-13

景甜个人资料，好漂亮性感迷人。

财运站长 ⋅ 12阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
48岁陈羽凡个人资料：罕见露面，开三百万豪车去聚会，身材发福生活很潇洒



财运站长 ⋅ 13阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
明道个人资料，娱乐圈的又一个黄金单身汉



财运站长 ⋅ 9阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
德云社角儿秦霄贤个人资料



财运站长 ⋅ 17阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
“顶级富婆”李冰冰个人资料：开2900万豪车身家百亿，一部戏片酬达上亿元



财运站长 ⋅ 19阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
音乐人·张碧晨个人资料

财运站长 ⋅ 17阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
华晨宇个人资料：“小众歌手”VS“大众偶像”

财运站长 ⋅ 4阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
叶梓萱的个人资料

财运站长 ⋅ 3阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
胡耘豪个人资料：颜值竟不输二月红。

财运站长 ⋅ 17阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
BLACKPINK-智秀女王个人资料



财运站长 ⋅ 18阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05

（2025年4月10日）今天废铝价格行情报价

五金 gzsihong ⋅ 7阅读量 ⋅ 0评论 ⋅ 2天前

2025-04-10
MIT研究揭示AI并无稳定价值观，“对齐”挑战远超预期

科技 gzsihong ⋅ 12阅读量 ⋅ 0评论 ⋅ 2天前

2025-04-10
民国十年袁大头银元价格（2025年04月08日）

五金 gzsihong ⋅ 14阅读量 ⋅ 0评论 ⋅ 4天前

2025-04-08
X200 Ultra专业相机设计！vivo黄韬：蓝厂史上颜值手感最好的超大杯

科技 gzsihong ⋅ 13阅读量 ⋅ 0评论 ⋅ 4天前

2025-04-08
04月07日今天草果行情价格查询

养殖知识 gzsihong ⋅ 22阅读量 ⋅ 0评论 ⋅ 5天前

2025-04-07
所谓“对等关税”严重影响全球医药供应链中国医药保健品进出口商会严正声明

商业与经济 gzsihong ⋅ 27阅读量 ⋅ 0评论 ⋅ 7天前

2025-04-05
4月3日今日鳊鱼市场价格行情查询

养殖知识 gzsihong ⋅ 9阅读量 ⋅ 0评论 ⋅ 9天前

2025-04-03
今日工业普圆价格查询（2025年4月2日）

五金 gzsihong ⋅ 17阅读量 ⋅ 0评论 ⋅ 10天前

2025-04-02
今天焊接钢管价格行情查询（2025年4月2日）

五金 gzsihong ⋅ 7阅读量 ⋅ 0评论 ⋅ 10天前

2025-04-02
搞笑游戏哪些好玩热门搞笑游戏精选

科技 gzsihong ⋅ 16阅读量 ⋅ 0评论 ⋅ 11天前

2025-04-02

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1