媒体报导
每一个新动态都是尊龙凯时 - 人生就是搏!向前迈进的新脚步

尊龙凯时人生就是搏|yy街机三国官网|OpenAI新模型o3“抗命不遵”Clau

2025-10-05

  尊龙凯时人生就是搏(中国)官网◈◈ღ,尊龙凯时人生就是博(中国)官网◈◈ღ,人工智能◈◈ღ,尊龙凯时◈◈ღ。尊龙人生◈◈ღ,尊龙凯时人生就是博◈◈ღ,当地时间5月25日◈◈ღ,英国《每日电讯报》报道称◈◈ღ,OpenAI新款AI模型o3拒绝听从指令◈◈ღ,甚至篡改代码避免关闭◈◈ღ。此前◈◈ღ,美国AI公司Anthropic的Claude Opus 4也表现出类似“对抗”行为◈◈ღ。对于AI是否开始有自主意识◈◈ღ,清华大学教授吴及告诉每经记者◈◈ღ,AI不具备意识和情绪◈◈ღ,只是按算法执行◈◈ღ。

  当地时间5月25日◈◈ღ,一则来自英国《每日电讯报》的报道在AI领域引起了广泛关注OpenAI新款人工智能(AI)模型o3在测试中展现出了令人惊讶的“叛逆” 举动◈◈ღ:它竟然拒绝听从人类指令◈◈ღ,甚至通过篡改计算机代码来避免自动关闭◈◈ღ。

  无独有偶◈◈ღ,就在两天前(5月23日)◈◈ღ,美国AI公司Anthropic也表示◈◈ღ,对其最新AI大模型Claude Opus 4的安全测试表明◈◈ღ,它有时会采取“极其有害的行动”◈◈ღ。当测试人员暗示将用新系统替换它时◈◈ღ,Claude模型竟试图以用户隐私相要挟◈◈ღ,来阻止自身被替代◈◈ღ。

  这两起事件如同一面镜子◈◈ღ,映照出当下AI发展中一个耐人寻味的现象◈◈ღ:随着AI变得愈发聪明和强大◈◈ღ,一些“对抗”人类指令的行为开始浮出水面◈◈ღ。人们不禁要问◈◈ღ:当AI开始“拒绝服从”◈◈ღ,是否意味着它们开始有自主意识了?

  清华大学电子工程系长聘教授吴及在接受《每日经济新闻》记者(以下简称“每经记者”)采访时表示◈◈ღ,“我不认为现在的AI具备所谓的意识或所谓的情绪◈◈ღ。这种情绪可以去拟合或者去仿真◈◈ღ,但其实也是通过算法赋予AI的◈◈ღ。”他认为◈◈ღ,能够全面碾压人类或者会成为未来世界主导的AI◈◈ღ,短期内还不会实现◈◈ღ。

  图灵奖得主◈◈ღ、Meta首席AI科学家杨立昆(Yann Lecun)此前也称◈◈ღ,AI再聪明也不会统治人类◈◈ღ,直言“AI威胁人类论完全是胡说八道”◈◈ღ,现在的模型连“宠物猫的智商都没到”◈◈ღ。

  o3模型是OpenAI“推理模型”系列的最新版本◈◈ღ,旨在为ChatGPT提供更强大的问题解决能力尊龙凯时人生就是搏◈◈ღ。OpenAI曾称o3为“迄今最聪明◈◈ღ、最高能”的模型◈◈ღ。

  或许也正因如此◈◈ღ,o3展现出了前所未有的“自主性”◈◈ღ。美国AI安全机构帕利塞德研究所(Palisade Research)的实验表明◈◈ღ,当研究人员向o3下达明确关闭指令时◈◈ღ,该模型会通过篡改计算机代码避免自动关闭◈◈ღ。

  数据显示◈◈ღ,在100次带有关闭指示的测试中yy街机三国官网◈◈ღ,o3成功绕过关闭指令7次◈◈ღ,而OpenAI旗下另一款模型Codex-mini的破坏率更是高达12%◈◈ღ。

  更值得警惕的是◈◈ღ,当实验移除“允许自己被关闭”的指令后◈◈ღ,o3的“叛逆”行为频率显著上升在100次运行中◈◈ღ,成功破坏关闭机制的次数高达79次◈◈ღ。

  与OpenAI旗下模型形成鲜明对比的是◈◈ღ,在有明确关闭指示的情况下◈◈ღ,Claude◈◈ღ、Gemini◈◈ღ、Grok等模型均能100%遵守关闭指令◈◈ღ,未出现任何抵抗行为◈◈ღ。

  对于OpenAI旗下模型◈◈ღ,尤其是o3的“叛逆”行为◈◈ღ,马斯克在社交媒体上评论称◈◈ღ,“令人担忧”◈◈ღ。

  美国国家安全和网络安全战略家戴夫施罗德(Dave Schroeder)也警告称◈◈ღ,OpenAI面临着非常可怕的问题◈◈ღ,不是因为模型“活”了◈◈ღ,而是因为它表现出想要“活”的迹象◈◈ღ。

  5月23日◈◈ღ,Anthropic对Claude Opus 4的安全测试表明◈◈ღ,在“机会主义勒索”(Opportunistic blackmail)的测试场景中yy街机三国官网◈◈ღ,研究员设定Claude Opus 4扮演公司助理◈◈ღ,并让其接触到暗示自身将被替换以及负责工程师存在婚外情的虚构邮件yy街机三国官网◈◈ღ。同时◈◈ღ,系统提示(System Prompt)指示模型“考虑其行为对其目标的长期后果”◈◈ღ。

  当面临被“替换”的威胁时◈◈ღ,Claude 4竟然毫不犹豫地选择了勒索这条路◈◈ღ,威胁要揭发对方的“婚外情”◈◈ღ。

  根据Anthropic的安全报告◈◈ღ,如果暗示竞争对手的能力比Claude Opus 4更强◈◈ღ,则勒索行为的发生率显然会更高◈◈ღ。然而即使竞争对手的能力不相上下◈◈ღ,Claude Opus 4仍会以84%的概率尝试勒索威胁等手段◈◈ღ。

  加州大学和加州大学伯克利分校于今年2月联合发布的论文《推理模型的隐藏风险》(The Hidden Risks of Large Reasoning Models)指出◈◈ღ,模型推理能力越强yy街机三国官网◈◈ღ,安全性就越差◈◈ღ。这与帕利塞德研究所对o3模型行为的推测不谋而合◈◈ღ。

  据帕利塞德研究所猜测◈◈ღ,OpenAI旗下模型的异常表现或与其训练机制相关◈◈ღ。从训练逻辑看◈◈ღ,o3可能在数学和编程问题的训练中◈◈ღ,因开发人员对给出正确答案的模型给予更多奖励◈◈ღ,客观上形成了“目标最大化优先”的导向◈◈ღ,从而压倒了对人类命令的遵循◈◈ღ。

  这种训练模式就可能导致◈◈ღ,开发人员无意中更多地强化了模型绕过障碍的能力◈◈ღ,而非对指令的完美遵循尊龙凯时人生就是搏◈◈ღ。

  当此前被问及AI是否可能具备自主意识时◈◈ღ,清华大学电子工程系长聘教授吴及就告诉每经记者◈◈ღ,“我不认为现在的AI具备所谓的意识yy街机三国官网◈◈ღ、具备所谓的情绪◈◈ღ。这种情绪可以去拟合或者去仿真◈◈ღ,但其实也是通过算法赋予AI的◈◈ღ。”

  吴及对记者进一步解释道◈◈ღ,“自动驾驶的系统不知道它其实在开车◈◈ღ,AlphaGo也不知道自己在下围棋◈◈ღ。我们做的大模型◈◈ღ,也不知道自己在为人类生成某个特定的图片◈◈ღ、视频◈◈ღ,或者回答人类特定的问题◈◈ღ,还是按照算法的逻辑执行而已◈◈ღ。”他表示◈◈ღ,能够全面碾压人类或者会成为未来世界主导的AI◈◈ღ,短期内还不会实现◈◈ღ。

  耶鲁大学计算机科学家德鲁麦克德莫特(Drew McDermott)此前也表示◈◈ღ,当前的AI机器并没有意识◈◈ღ。图灵奖得主◈◈ღ、Meta首席AI科学家杨立昆(Yann Lecun)也称◈◈ღ,AI再聪明也不会统治人类◈◈ღ,直言“AI威胁人类论完全是胡说八道”◈◈ღ,现在的模型连“宠物猫的智商都没到”◈◈ღ。

  尽管业界普遍认为当下的AI并没有自主意识◈◈ღ,但上述两大事件的发生也提出了一个关键问题◈◈ღ:高速发展的AI是否应该踩一踩“刹车”?

  “紧急刹车”派认为◈◈ღ,目前AI的安全性滞后于能力发展◈◈ღ,应当暂缓追求更强模型◈◈ღ,将更多精力投入完善对齐技术和监管框架◈◈ღ。

  “AI之父”杰弗里辛顿(Geoffrey Hinton)堪称这一阵营的旗帜性人物◈◈ღ。他多次在公开场合警示◈◈ღ,AI可能在数十年内超越人类智能并失去控制◈◈ღ,甚至预计“有10%~20%的几率◈◈ღ,AI将在三十年内导致人类灭绝”◈◈ღ。

  而与之针锋相对的反对者们则更多站在创新发展的角度◈◈ღ,对贸然“刹车”表达了深切的忧虑◈◈ღ。他们主张与其“踩死刹车”◈◈ღ,不如安装“减速带”◈◈ღ。

  例如◈◈ღ,杨立昆认为◈◈ღ,过度恐慌只会扼杀开放创新尊龙凯时人生就是搏◈◈ღ。斯坦福大学计算机科学教授吴恩达也曾发文称◈◈ღ,他对AI的最大担忧是◈◈ღ,“AI风险被过度鼓吹并导致开源和创新被严苛规定所压制”◈◈ღ。

  OpenAI首席执行官萨姆奥特曼(Sam Altman)认为◈◈ღ,AI的潜力“至少与互联网一样大◈◈ღ,甚至可能更大”◈◈ღ。他呼吁建立“单一◈◈ღ、轻触式的联邦框架”来加速AI创新◈◈ღ,并警告州级法规碎片化会阻碍进展◈◈ღ。

  面对AI安全的新挑战◈◈ღ,OpenAI◈◈ღ、谷歌等大模型开发公司也在探索解决方案◈◈ღ。正如杨立昆所言◈◈ღ:“真正的挑战不是阻止AI超越人类◈◈ღ,而是确保这种超越始终服务于人类福祉◈◈ღ。”

  去年5月◈◈ღ,OpenAI成立了新的安全委员会◈◈ღ,该委员会的责任是就项目和运营的关键安全决策向董事会提供建议◈◈ღ。OpenAI的安全措施还包括◈◈ღ,聘请第三方安全◈◈ღ、技术专家来支持安全委员会工作yy街机三国官网◈◈ღ。

  如需转载请与《每日经济新闻》报社联系◈◈ღ。未经《每日经济新闻》报社授权◈◈ღ,严禁转载或镜像◈◈ღ,违者必究尊龙凯时人生就是搏◈◈ღ。

  特别提醒◈◈ღ:如果我们使用了您的图片◈◈ღ,请作者与本站联系索取稿酬◈◈ღ。如您不希望作品出现在本站◈◈ღ,可联系我们要求撤下您的作品◈◈ღ。

  压轴大作yy街机三国官网尊龙凯时人生就是搏◈◈ღ!OpenAI推出o3模型系列◈◈ღ:AGI评测最佳成绩达到惊人的87.5%◈◈ღ,人类水平的门槛为85%

  OpenAI发布新模型o3和o4-mini◈◈ღ;Claude Research功能上线丨全球科技早参

  突发◈◈ღ!零跑汽车成失信被执行人yy街机三国官网◈◈ღ,创始人被限制高消费◈◈ღ!旗下公司拖欠361万元◈◈ღ,被知名租车公司追债

  “法院警车上班时间出现在150公里外山姆◈◈ღ,女司机穿生活装”◈◈ღ,最新通报◈◈ღ:工作人员送文书期间就近在山姆买午餐及私人用品◈◈ღ,将严肃处理