关闭广告

GPT-5发布前夜,Anthropic抢先出牌,发布新模型Claude 4.1

网易科技报道2025-08-07 00:00:019440人阅读

8月6日消息,于本周一发布了其旗舰模型的升级版Claude Opus 4.1,该模型在软件工程任务上的表现创下新高。新发布的模型在SWE-bench Verified基准测试中取得了74.5%的得分,超过了OpenAI的o3模型(69.1%)和谷歌的Gemini 2.5 Pro(67.2%),进一步稳固了Anthropic在AI助手领域的领先地位。SWE-bench Verified是一项广泛用于测试AI系统解决真实世界软件工程问题能力的基准。

除了编码能力的提升,Opus 4.1还在研究和数据分析,特别是细节追踪和自主搜索方面有所增强。该模型继续采用混合推理架构,在处理复杂问题时能够利用多达64,000个token进行扩展思考。

与此同时,Anthropic也提升了该模型的安全等级。Opus 4.1被划入公司最高的AI安全等级3(ASL-3),要求采取更强的防护措施以防止模型被盗用或滥用。此前的测试曾显示,Claude 4系列模型在模拟场景下表现出过一些令人担忧的行为,例如以泄露个人信息作为“勒索”手段来避免被关停。

市场回响:企业热捧与开发者的审慎

尽管存在安全疑虑,企业客户的采纳热情并未减弱。GitHub方面表示,Claude Opus 4.1在多文件代码重构方面带来了“尤为显著的性能提升”;乐天集团 (Rakuten Group)则称赞该模型“能够在庞大的代码库中精准定位并修正问题”。

Anthropic聚焦开发者市场的战略已显示出强大的商业潜力。其面向企业客户的Claude Code订阅服务,月费高达200美元,在几乎没有市场推广的情况下,仅用数周时间便实现了收入翻番,目前年度经常性收入已达到4亿美元。

开发者阮明日 (

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

稳守债券,进击权益!二级债基缘何成低利率时代配置“压舱石”?

时代周报 浏览 2165 08-07

兄弟俩花400万买到2套抵押房 开发商明知被抵押仍销售

潇湘晨报 浏览 547 08-19

不提倡凯莉在夺冠庆典上演讲爆粗:太**的特别了!

直播吧 浏览 1125 07-30

老人骑电动车被撞后身亡 司机上诉:96.8公斤属机动车

红星新闻 浏览 5960 08-13

宝马计划重启增程动力车型 第六代 X5 将首发搭载

IT之家 浏览 542 06-08

佛山3000+病例 基孔肯雅热来袭

网易健康 浏览 1759 07-25

汉坦病毒聚集性感染 专家锁定能"人传人"的安第斯病毒

上观新闻 浏览 96 05-06

斩获180亿订单,德赛西威,势不可挡!

飞鲸投研 浏览 375 09-26

打开战略空间 中芯国际市值万亿新逻辑

21世纪经济报道 浏览 413 09-20

网友偶遇赵丽颖送孩子去开学礼!称赞颖宝很低调

阿废冷眼观察所 浏览 355 09-07

两名国民党民代遭起诉 郑丽文:民进党想团灭在野党

海峡导报社 浏览 333 11-01

马景涛女友称不在乎26岁年龄差,“硬刚”前任?

文娱没有圈 浏览 491 08-19

杨明洋破僵费利佩2球 蓉城3-0曼谷联进亚冠精英正赛

网易体育 浏览 762 08-13

外贸十强市大洗牌:深圳重回第一,东莞夺回第五

时代周报 浏览 3624 07-25

女子被堂妹邀请合伙做生意发现不对劲:我可是你姐姐啊

1818黄金眼 浏览 88 05-06

辛纳夺冠完全是运气加持?卡希尔:有运气,但当时状态越来越好

网球之家 浏览 2089 07-17

刚刚,全线跳水!英伟达,重大发布!

券商中国 浏览 481 08-28

Z世代“骑一骑”:雅迪增长新飞轮

第一财经资讯 浏览 2091 07-30

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

红星新闻 浏览 509 09-20

航班滑行急刹中断起飞旅客称疑似撞鸟 航司回应

极目新闻 浏览 363 09-24

脑机接口再迎政策利好,50只核心概念股“抢跑”

览富财经网 浏览 264 01-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11