【大模型系列38】关于Sonnet5,你想知道的一切【更新LiveBench评分】

dwqxq1 2026-07-01 22:34 1


官方文:Introducing Claude Sonnet 5 \ Anthropic


系统卡(145页):https://www-cdn.anthropic.com/9e6a1044980d8c4ed85669faf9c2a8342e2e9f1e/Claude%20Sonnet%205%20System%20Card.pdf


上下文


1m


价格


长期$3/$15价格不变,但临时调$2/$10到8月31号

考虑A社并没有降价习惯,推测可能是因为

Ⓐ换分词器导致更费token

Ⓑ应对5.6-luna的性能冲击

Ⓒ应对glm5.2的价格冲击


评分


自评


新能介于sonnet4.6和opus4.8之间
















LiveBench评分

来源:LiveBench




LMArena评分:暂未上线

来源:Arena Leaderboard | Compare & Benchmark the Best Frontier AI Models




ArtifactialAnalys评分:暂未上线

来源:https://artificialanalysis.ai/










API渠道


官网


OpenRouter


来源:Claude Sonnet 5 - API Pricing & Benchmarks | OpenRouter




最后,发个梗图,祝佬友与Sonnet5愉快的玩耍





最新回复 (6)
  • dwqxq1 楼主 07-01 22:34
    1

    我近期其他帖子




    .🔥【大模型系列37】关于GPT-5.6,你想知道的一切

    .🔥【大模型系列36】关于Fable5/Mythos5,你想知道的一切【底楼更新封禁分析】

    .🔥【大模型系列35.1】opus-4.8用于Claude Code写作评价

    .🔥【大模型系列35】关于Opus-4.8,你想知道的一切【底楼更新LMArena】

    .🔥【大模型系列34.3】为什么Google从AI老二变老三了?怎样完美错过Agent时代第一阶段

    .🔥【大模型系列34.2】逆水行舟,不进则退:评Google在IO 26大会表现和未来预测

    .🔥【大模型系列34.1】gemini-3.5起,谷歌狂砍Pro会员额度,田忌赛马耍猴惹众怒

    .🔥【大模型系列34】关于gemini-3.5-flash,pro和Google IO 26,你想知道的一切【更新Arena,AAnalysis评分】

    .🔥【大模型系列34.0】Gemini-3.5预热贴,新$100的5x会员,veo4,3.5flash涨价3倍,Pro会员额度砍到1/4膝盖斩

    .🔥【大模型系列33】关于Deepseek V4,你想知道的一切




    .🔥【省钱系列15】还在用opus4.6吗,Claude Code里4.6消耗速度是4.7的4倍

    .🔥【省钱系列13】Claude Code Max砍额度了?到底是怎么算的?独家解方程得真相

    .🔥【省钱系列12】【260629尼区价格翻倍,好日子到头了】尼区买Timon信用卡教程,$77买Claude Max 5x,$152买20x,$12买Pro,封号退到卡

    .🔥【省钱系列11】我做的Claude Code Saver,争取做最强CC额度监控+省钱插件【预告贴】




    .【AI大战系列11】OpenAI这么讨人嫌么,R站认为OpenAI会率先实现AGI的票数,仅比中国模型概率高一点

    .🔥【AI大战系列10】用非洲草原生态解释中美AI竞争(狮子王版)

    .🔥【图像视频系列8】关于Gemini-omni-flash,你想知道的一切

  • dwqxq1 楼主 07-01 22:35
    2

    ###260701 ^-^最佳拍档⁵ Claude Sonnet 5发布 | Fable 5解禁 | 智能体能力 | 成本效率优势 | 安全性 | 网络安全 | 市场竞争 | IPO | 能力下放加速 | 商业化****Claude Sonnet 5发布 | Fable 5解禁 | 智能体能力 | 成本效率优势 | 安全性 | 网络安全 | 市场竞争 | IPO | 能力下放加速 | 商业化

  • dwqxq1 楼主 07-01 22:37
    3

    260701 ^-^隐枫视野⁵ ▷Anthropic隐蔽核查用户,本质是在作恶


  • dwqxq1 楼主 07-01 22:38
    4

    260630 ^-^NiceKate AI⁵ ▷Claude Sonnet 5实测:图像识别、3D建模、网页生成等8个真实任务


  • dwqxq1 楼主 07-01 22:39
    5

    260630 ^-^Arena AI ▷Claude Sonnet 5|First impressions


  • 巧克力雷轰 07-01 23:00
    6

    只能评价为糊弄

    目前看旗舰模型和平价模型的生产力差距,已经不能是“多来两轮无所谓,反正便宜,可以原谅”的了

    3.5f的尴尬境地就是一大作证

* 帖子来源Linux.do
返回