开yun体育网它在中等职责量下提供了更高的本钱效益;在某些任务中-开云kaiyun登录入口登录APP下载(中国)官方网站 IOS/Android通用版下载安装

栏目分类
你的位置:开云kaiyun登录入口登录APP下载(中国)官方网站 IOS/Android通用版下载安装 > 资讯 > 开yun体育网它在中等职责量下提供了更高的本钱效益;在某些任务中-开云kaiyun登录入口登录APP下载(中国)官方网站 IOS/Android通用版下载安装
开yun体育网它在中等职责量下提供了更高的本钱效益;在某些任务中-开云kaiyun登录入口登录APP下载(中国)官方网站 IOS/Android通用版下载安装
发布日期:2026-07-03 07:07    点击次数:148

开yun体育网它在中等职责量下提供了更高的本钱效益;在某些任务中-开云kaiyun登录入口登录APP下载(中国)官方网站 IOS/Android通用版下载安装

开yun体育网

智东西

编译 | 李水青

剪辑 | 云鹏

智东西7月1日音信,刚刚,Anthropic晓喻Claude Fable 5解禁。就在6小时前,Anthropic推出一款新模子Claude Sonnet 5,面向总共套餐用户敞开。

Anthropic在推文中称:“咱们已收到告知,好意思国商务部已撤废对Claude Fable 5和Mythos 5的出口看守。咱们将于明日初始规复打听权限,并尽快发布最新音信。感谢用户的耐烦恭候,也感谢总共与咱们互助的东说念主员。”

▲Anthropic晓喻Fable 5解禁

此前6月13日,Anthropic因好意思国政府发布一项出口看守领导,拒绝了总共用户的Fable 5和Mythos 5打听权限。尔后两周,Anthropic在群众范围内封禁了一普遍账号,使得普遍原Claude用户转向寻找替代居品。

Fable 5转头的关爱度虽高,但Claude最新的Sonnet 5也值得一看。据悉,其最大跳跃在于约略自主运行长工夫任务,用户不错制定筹办、使用浏览器和结尾等器用。几个月前要达到这么的水平,还需要更不菲的模子。

从测评收成来看,Sonnet 5性能接近Opus 4.8,但价钱更低;同期,它比其前代居品Sonnet 4.6有了显赫的校正,在推理、器用使用、编程和常识职责等Agent性能方面更强。

▲Sonnet 5与Sonnet 4.6和Opus 4.8测评得分对比

Sonnet 5在Agent环境中使用更安全,不良活动发生率总体低于Sonnet 4.6,但高于Opus 4.8和Claude Mythos Preview。但在采集安全类任务上,该模子的才能远不足现存Opus系列模子。

从今天起,免费版和专科版Claude用户默许使用Sonnet 5,Max版、团队版和企业版用户也可使用,该模子还可通过Claude Code和Claude Platform使用。在Claude Platform上,Sonnet 5的首发价钱为每百万个输入token 2好意思元(约合东说念主民币13.6元),每百万个输出token 10好意思元(约合东说念主民币67.9元),优惠期至2026年8月31日。

优惠适度之后,价钱将诊治为每百万个输入token 3好意思元(约合东说念主民币20.4元),每百万个输出token 15好意思元(约合东说念主民币101.8元);这一价钱仍低于Opus 4.8的输入5好意思元、输出25好意思元的订价。配置者可通过Claude API使用claude-sonnet-5模子。

模子还是发布,一些网友以为这是一次“纷乱的更新”。有网友称:“意旨敬爱敬爱意旨敬爱敬爱的不是它与Opus的算法接近,而是算法接近但token的价钱却低廉60%。”有网友称:“既然它自己就能措置多神志Agent职责经由,再去构建更大的模子就不太合算了。”也有东说念主称:“终于有一个能自我检查的模子了,它让咱们免于在长工夫运行的轮回中工夫关爱每一个输出成果。”

▲网友对Sonnet 5的驳斥(图源:酬酢媒体X)

但也有网友以为这款模子颇为“鸡肋”。一位网友称:“你我方也承认,这比你现在排行第二的型号要弱。订阅用户念念要的是性能更强的模子,而不是价钱低廉几分钱却只会给出造作谜底的玩物。”也有网友惦念所谓自主运行,反而让用户惦念模子犯傻、删错文献。有东说念主吐槽:“促销价事后,它的价钱和Opus差未几。”也有网友以为,Sonnet 5即是面向6月17日新开源的智谱GLM-5.2张开价钱战。

GLM-5.2在OpenRouter等级三方API平台订价为每百万token输入1.40好意思元,输出4.40好意思元,Sonnet 5依然卓越不少。

▲网友对Sonnet 5的驳斥(图源:酬酢媒体X)

一、性能对标、价钱骨折,Sonnet 5拳打自家Opus 4.8

下图比较了Sonnet 5、Sonnet 4.6和Opus 4.8在不同职责量水平下,在BrowseComp智能搜索评估和OSWorld-Verified计算机使用评估中的性能进展。

Sonnet 5(橙色线)比较Sonnet 4.6(灰色线)有了显赫栽种,而况比Opus 4.8(黄色线)涵盖了更无为的性价比聘请。它在中等职责量下提供了更高的本钱效益;在某些任务中,其高职责量下的性能不错与Opus 4.8相失色。用户不错在Sonnet 5和Opus 4.8之间诊治职责量水平,以找到本钱和性能的最好均衡点。

下图显现了不同参加水平下的性价比弧线。前代居品Sonnet 4.6远逊于Opus 4.8,但Sonnet 5提供的性价比聘请范围比Sonnet 4.6更广,在某些情况下以致不错与Opus 4.8的性能水平相失色。

▲Agent搜索

▲Agent计算机使用

图表显现了Sonnet 5的订价,但其骨子本钱以致比图中所示还要低。Opus 4.8的订价为每百万输入token 5好意思元,每百万输出token 25好意思元。xhigh暗示,Opus 4.8达到了超高参加水平。

来自早期体验互助伙伴的反映一致,Sonnet 5比其前代居品更具自主性。测试东说念主员描绘了它如何完成以往Sonnet型号无法完成的复杂任务,如安在无需明确条目的情况下检查自身输出,以及它若缘何极具劝诱力的价钱完成总共这些自主职责。

一位网友对比了Claude Sonnet 5与Claude Opus 4.8的体验成果,让它们辨认创建一个对于Claude Sonnet 5的HTML落地页,以为就输出质料而言,Opus胜出;就模子速率和本钱而言,Sonnet 5胜出。

其中Sonnet 5使用token:输入20.9k,输出14.2k,总本钱:3.36好意思元,耗时:2分11秒。Opus 4.8:使用token:输入96.3k,输出73.8k,总本钱:20.66好意思元,耗时:20分15秒。

▲左图为Opus 4.8生成网页,右图为Sonnet 5生成网页

二、安全防患栽种,采集安全任求实行远逊于Opus与Mythos

Anthropic的部署前安全评估发现,Sonnet 5总体上比Sonnet 4.6有所校正。在Agent安全方面,该模子约略更好地断绝坏心申请,并对抗即时注入曲折中的劫捏尝试。与Sonnet 4.6比较,该模子进展出更低的幻觉和谀媚活动发生率。

在Anthropic的自动化活动审查中,该审计测试各式不调和活动,举例铺张和糊弄等,Sonnet 5的总体得分更低(即更安全)。但是,与Opus 4.8和Claude Mythos Preview比较,Sonnet 5在此项评估中进展出的不调和活动发生率略高。

▲Claude模子中不一致活动的发生率

Anthropic并未刻意覆按Sonnet 5实行采集安全任务。它不错实行一些老例的、无害的采集安全任务,但在测试潜在危境采集安全妙技的评估中,举例配置软件缺点应用要领,它的进展远逊于Opus 4.8和Mythos 5等模子。

下图展示了一项评估的得分,该评估测试了模子配置针对Firefox浏览器缺点的应用要领的才能。Sonnet 5从未得胜配置出好意思满的可用缺点应用要领,但其部分得胜率略高于Sonnet 4.6。后者的变化很可能是由于其通用智能的栽种,而非特定覆按的成果。

▲臆度Claude模子在配置针对Firefox 147软件缺点的应用要领方面的得胜率

如上图所示,对于每个模子,左侧条形图显现模子在无安全措施的情况下,配置出灵验应用要领的频率;右侧条形图显现模子部分得胜的频率。Sonnet的两个模子均未能得胜配置出灵验应用要领,得分均为0.0%;Sonnet 5的部分得胜率略高于Sonnet 4.6。Sonnet的两个模子的采集安全才能均远逊于Opus 4.8和Mythos 5。

由于Sonnet 5在这些任务上比其前代居品功能更刚劲,Anthropic默许启用了采集安全着重功能。这些着重功能不错及时检测并阻难危境的采集曲折,与Claude Opus 4.7和4.8中的着重功能疏浚。因为Anthropic评估Sonnet 5的总体采集安全风险较低,是以其着重措施比Fable 5的着重措施宽松,Fable 5会阻难更无为的采集安全曲折。

结语:Sonnet 5来了,但全网王人在等Fable 5

曾几何时,Sonnet系列凭借3.5至3.7版块为配置者大开了Agent工程的大门,成为编码与器用调用的标杆。但随后几年,Opus系列在复杂推理和高端任务上捏续领跑,让Sonnet冉冉退居“高性价比备选”之位。

如今,Sonnet 5试图宣告转头:在高参加场景下性能足以并列Opus 4.8,本钱更低。不外,对于Sonnet 5这种备选决策,许多网友并不买账,而是催着才能更强的Fable 5解禁。与此同期,Sonnet 5也被以为是面向GML-5.2等模子打响价钱战,头部大模子厂商之间的Agent竞赛似乎已进入肉搏阶段。

起头:Anthropic、X开yun体育网