今天我的 gpt-5.5 不到 40 tokens/s,这合理吗?

dill 2026-07-03 23:13 1

美国甲骨文,docker 里面部署的 CPA 反代 Codex,本机 axonhub 连接到 CPA。本地 OPENCODE 接 axonhub 用。今天只有 38 tokens/s 的速度。TTFT 看着还比较正常。如图:





太慢了,同时跑 3 个项目才烧了 2 亿 tokens,pro 20x 怎么用得完啊。


还在 CPA 开了 service_tier = priority。但看 CPA 请求日志返回的还是 service_tier = default,似乎并没有用:

最新回复 (2)
  • dill 楼主 07-04 09:46
    1

    大家速度都是多少啊?我这个正常吗

  • enget 07-04 09:47
    2

    合理,gpt 订阅就是这么慢……

* 帖子来源Linux.do
返回