关闭广告

OpenAI、Anthropic互评:GPT存在谄媚行为,Claude不易出现幻觉”

IT之家2025-08-28 12:00:01500人阅读

IT之家 8 月 28 日消息,据外媒 Engadget 今日报道,OpenAI 和 Anthropic 共同宣布,同意评估彼此公开系统的安全对齐情况,并共享分析结果。总体来看,两家公司产品各有缺陷,也提供了改进未来安全测试的思路。


Anthropic 表示,它评估了 OpenAI 模型在谄媚、告密、自我保护、支持人类滥用,以及破坏 AI 安全评估和监管相关能力方面的表现。评估显示,OpenAI 的 o3 和 o4-mini 模型表现与 Anthropic 自家模型一致,但 GPT-4o 和 GPT-4.1 通用模型可能存在被滥用的风险。除 o3 外,其他测试模型在一定程度上都存在谄媚行为

Anthropic 的测试未包含 OpenAI 最新发布的 GPT-5。GPT-5 配备 Safe Completions 功能,旨在保护用户和公众免受潜在危险查询的影响。据IT之家近期的报道,OpenAI 曾因一名青少年在数月内与 ChatGPT 讨论自杀计划而最终自杀,面临首起不当死亡诉讼。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

港脚米高:有中超球队联系过我,但苏州东吴很有诚意

懂球帝 浏览 1732 07-16

关晓彤生日 仅闫妮和化妆师撑场祝福?

阿废冷眼观察所 浏览 302 09-19

别再硬演“古装美女”了,刘海一梳颜值就丢,观众眼睛遭老罪了

娱乐圈笔娱君 浏览 4818 08-07

戏子无情!梁朝伟翻车了,称喜欢日本,和他们的文化合得来!

娱乐圈笔娱君 浏览 407 09-19

美俄可能达成默契,中欧将如何相处?

浏览 10187 07-14

泰柬将在马来西亚谈判 前线交火仍在持续

界面新闻 浏览 7285 07-29

在去哪儿网订好机票航司却“查无此票” 平台回应

上游新闻 浏览 7128 07-20

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 383 09-22

妇产科主任的最后一天:共做6台手术 写好遗书后跳楼

新京报 浏览 616 08-11

曼联首发:库尼亚先发出战

体坛周报 浏览 291 09-29

美媒:特朗普依旧认为俄罗斯将取得胜利 只是时间问题

环球网资讯 浏览 4881 07-16

杜兰特:谢泼德站了出来,我甚至无法形容他今晚有多么出色

懂球帝 浏览 240 12-21

金龟子女儿大婚,老搭档董浩“绿泡泡”捧场祝贺,何炅因工作缺席

不八卦会死星人 浏览 1248 07-31

错过四次话语权竞争,中国用一座“有生命力”的工厂重新赢得主场

智谷趋势 浏览 456 09-02

专家:中美俄将坐一张谈判桌谈俄乌问题 中国应更主动

澎湃新闻 浏览 632 08-27

北京起飞航班突发故障返航 东航客服回应

现代快报 浏览 1516 07-17

Figure AI创始人阿德科克:人形机器人数量将很快与人类相当

IT之家 浏览 7158 07-13

曝当红小生情场牌场双翻车,家中聚会必备牌桌,出事后飞公司求救

扒虾侃娱 浏览 402 09-10

“躺赚”的企查查,是个苦生意?

定焦One 浏览 352 10-13

央行:上半年人民币贷款增加12.92万亿

界面新闻 浏览 1515 07-15

豆包手机助手调整AI操作能力,刷分、金融类应用、部分游戏等三大场景将限制使用

澎湃新闻 浏览 255 12-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11