真的没人觉得 codex 比 claude 笨很多吗?

yaocy 2026-07-02 19:00 1

甚至一些低级问题,比如一行注释不写,不知道自己生成单元测试,额外多写几个不必要的类出来,也不向我逐个确认要点

最新回复 (64)
  • linbenyi 07-02 19:02
    1
    可能也是定价的底气吧。
  • allgy 07-02 19:09
    2
    还行啊,约束条件给得多,codex 也能变 claude
  • hengxiangbianhua 07-02 19:25
    3
    我也觉得 codex 不太行,现在各种模型价格差不了多少,能力确实天差地别
  • billccn 07-02 19:25
    4
    这两家同档次的模型实际能力差不多,但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。

    另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。
  • banricho 07-02 19:32
    5
    不觉得,持续优化项目的 AGENTS.md ,一次性把话说清楚最重要
  • chengkai1853 07-02 19:33
    6
    和你感觉相反,Codex 比 Claude 细致太多了
  • niubee1 07-02 19:36
    7
    感觉现在有些人动辄非 Claude 不能干活,我就怀疑你是搞什么外星科技呢,离开 Claude 你就是个瘸子了?不会干活了?
  • lightryanking 07-02 19:48
    8
    一起用 codex5.5 fable 都很好;

    谷歌 gemini 啥的就拉跨了
  • yzw7489757 07-02 19:50
    9
    电油之争?别比谁最好,差的是使用习惯和姿势。

    相反,我觉得 codex 比 claude 更好操作,边界也相对可控。
  • noahliaszn 07-02 19:54
    10
    都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
    2 个一起用一个做 plan 一个做 execute
  • lianyue 07-02 20:02
    11
    codex 很喜欢自己写代码 都不知道用依赖 不知道去找 github
    然后 代码 很乱真的很乱 功能文件 输入输出 接口等都不清晰 代码到处放
    连 cursor 的 auto 都不如 真的 结构性一点都不如他
    但是基础功没问题 缺调教 AGENTS.md 要约束的规则偏多很多
    吧 AGENTS.md 写好
    我觉得边界会很清晰
    现在 我 AGENTS.md 强制了 4 个文档
    TESTING.md README.md FLOW.mmd AGENTS.md
    叫他动手之前有必看
    并且 前三个文档是必须的 改动了必须对齐 尤其是 flow.mmd 流程图 基本我 不看内部代码 只看流程图+ 输入输出接口 和输入输出约束就行了
  • yzw7489757 07-02 20:04
    12
    楼上,一堆错别字...
  • canyue7897 07-02 20:06
    13
    跟楼主相反
    codex 是唯一一个能严格按照我的要求干完活儿的
    其余的或多或少都会偷懒
  • ebushicao 07-02 20:11
    14
    Codex 最近确实很笨,降智严重。不过一行注释不写不是什么问题吧,vibe coding 没注释更好吧,agent 自己去看代码比被注释带偏好多了
  • kuhung 07-02 20:15
    15
    Codex 比较喜欢写防御性编程,生成一大堆假设。
  • Cloudiver 07-02 20:39
    16
    @chengkai1853 同意,claude 虽然落地快,但 bug 很多。GPT 相对严谨、细心很多
  • Jamieyang 07-02 20:52
    17
    Codex 不是蠢,是懒。比 Claude 更懒就用得更累
  • zuosiruan 07-02 20:54
    18
    @chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多,尤其是和 opus4.8 比
  • wolfie 07-02 21:22
    19
    gpt-5.4/5.5 指令依从度太差,而且经常丢上下文。
  • PerFectTime 07-02 21:23
    20
    有什么好争的, 我觉得是人的问题
  • little_cup 07-02 21:40
    21
    我的感受是,Codex 系列更适合于依据长文档进行开发; Claude 系列更适合许愿式开发。
    当然,Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格,Codex 量实在多太多了。
  • wonderfulcxm 07-02 21:45
    22
    @lianyue codex 写代码不是项目决定的吗?相反,我觉得 codex 很爱参考代码,比如写一个 wordpress 插件,它会参考我之前写的插件,结构和代码风格保持高度一致。
  • HappyAndSmile 07-02 21:53
    23
    codex 确实是比 Claude code 差很多的,只能通过建立自己的经验.md ,让它弥补自身的缺陷
  • v2gba 07-02 21:55
    24
    opus 也傻逼

    只是 fable 暂时独一档而已 看看 5.6 吧
  • fovecifer 07-02 22:16
    25
    GPT5.5 目前写代码是性价比最高的
    Opus 比较适合做架构之类的工作
  • KING754 07-02 22:47
    26
    真的没有人用 cursor 吗?
    量大,各种模型可以随心所欲。
    可视化 UI ,操作简单。
  • zhuang0718 07-02 22:50
    27
    主要是最近降智的原因吧
  • noqwerty 07-02 23:01
    28
    叽里咕噜说啥呢,反正都比我聪明多了
  • ifconfig 07-03 00:49
    29
    codex:现在重跑同一个 suite ,看 10 个测试是否全部通过,尤其是刚才红的那条
  • DefoliationM 07-03 01:29
    30
    不觉得,挺好用的,不过写前端不咋地,后端完全按照我的要求来。
  • 1874w 07-03 03:38
    31
    我个人觉得大部分是人的问题.

    如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明

    那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文

    而且由于变量的不同,会有一些可能存在的错误判断.

    比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题.

    后面 换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题

    所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重

    但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B

    ==========================================================

    所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文.

    理论来说用能力相对低一些的模型 + 稳定工作流 也能解决你的问题.

    superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决.

    所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文.

    我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档.

    例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了.

    之前在 X 上也看到一个方法论:

    在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题

    感觉可以试试,也能学习到该如何和 AI 进行交流
  • germain 07-03 03:43
    32
    这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己,如果现在失业去面试,自己在面试桌上是个什么样的角色。
  • 1874w 07-03 03:45
    33
    @1874w 如果这些本地文档不想提交到远端仓库 或者 污染提交历史,可以参考我的这篇博客来设置 git 忽略

    这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库


    https://blog.1874.cool/vibe-coding-mid-doc
  • 1874w 07-03 04:00
    34
    @little_cup 我感觉 你可以总结下他的 过度的防御式编程 规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分
  • Yasuke 07-03 08:49
    35
    反正我两个都用,codex 比 cc 好多了,就是 codex 写 ui 简直让人眼前一黑
  • nVic 07-03 08:50
    36
    他俩严格来说不是一类工具。
  • coreJK 07-03 08:53
    37
    @KING754 #26 之前用得多,但是 cursor 动不动就没响应了
  • mywind 07-03 09:05
    38
    我感觉可能和上下文信息有关,如果一个工具用久了,积累了相对多的上下文信息,用起来就会顺手很多,这时候再用另一个就会感觉不太顺手。
    我个人用 Codex 多一下,个人的感受 Codex 相对细致,但也更循规蹈矩,Claude 对一些开放性问题会相对有洞察一些,但是也喜欢自嗨。两个都不能突破使用者本身能力的上限,会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。
  • Meteora626 07-03 09:17
    39
    codex 上下文管理一绝好吧,远程压缩一个上下文记录好多东西 和大模型压缩一个天一个地
  • nebulabox 07-03 09:25
    40
    和你感觉相反,Codex 比 Claude 好用
  • potatowish 07-03 09:27
    41
    codex 就是缺少一点灵性。写代码比较死板,严谨过头,它甚至改个注释都要给我重新编译一遍。
  • houOne 07-03 09:44
    42
    codex 比我聪明很多,就挺好的。 我也想用 claude 用不上~
  • NASK 07-03 09:59
    43
    首先确认一下你的 codex 推理等级是不是 xhigh
  • Mandelo 07-03 10:01
    44
    但是奥特曼不封号
  • Bluecoda 07-03 10:07
    45
    并没有,只要 context 足够小,足够窄,并不觉得 codex 比 cc 差多少
  • malatang 07-03 10:12
    46
    没有啊
  • hengxiangbianhua 07-03 10:16
    47
    @NASK 我觉得 xhigh 反而不好
  • rb6221 07-03 10:16
    48
    都别吵了,大家一样烂,要我说最强的还得是古法编程[doge]
  • NullIsLife 07-03 10:21
    49
    能畅饮 cc 的会用 codex 吗
  • clemente 07-03 11:09
    50
    @NullIsLife 我都用啊
  • lovelyidiot 07-03 11:31
    51
    codex 65 分,claude 75 分,差不多就这样。前者比一半以上人强,后者比 3/4 以上人强。65 分就是有经验、能做,做的也就那样,没新意。75 分就是能做,明显比大部分人做的更好,但做不了 85 分人能做到的程度。
  • bojue 07-03 11:36
    52
    @lightryanking 北美豆包
  • keenkiller 07-03 12:07
    53
    codex 确实不写注释,你要跟他说他才会补
  • fatigue 07-03 12:17
    54
    恰恰相反,claude 一个对话刚开始还好,用着用着就开始退化,最后会困在某个点死活出不来,codex 整体性要好很多,很少会卡住
  • Isuxiz 07-03 13:39
    55
    codex 现在有个 bug ,症状是固定 516 reasoning token ,体验就是模型降智很厉害
    https://github.com/openai/codex/issues/30364
    等修复吧
  • ooppstef 07-03 13:46
    56
    我的天?居然会有人觉得 claude 比 gpt 强? 推理能力完全不在一个层级好吧。。。疯了,当然 gpt 的前端能力很弱,这个 gpt 自己也承认,但推理,review ,找 bug ,写代码的严谨性,把 claude 吊起来打啊。


    不过降智了,就没什么好聊的。。。
  • NullIsLife 07-03 14:04
    57
    @clemente #50 能说说在畅饮 cc 的情况下,什么场景你会想用 codex
  • diaoyulao9657 07-03 15:12
    58
    两个都在用,Claude code 适合当军师,Codex 适合干苦力,一个出谋划策做监工,一个猛猛干
  • xidaduo 07-03 15:23
    59
    Claude 在出方案和产品思路方面比 Codex 好太多,Codex 干有详细文档和计划的活比较稳定,在执行层面比较靠谱。一个胜在创新想法,一个胜在干活稳定、使用也更稳定
  • MuyuQ 07-03 15:26
    60
    我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务,告诉他别写那么多,费的是我的 token 。
  • smileeast 07-03 15:39
    61
    @1874w #31 superpowers 这个太费 token 了,我现在用 https://github.com/mattpocock/skills 这个 skill ,这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了,那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行,这是四个层级,很多人想的是直接从我想的就变成执行层,这明显是有问题的。
  • elevioux 07-03 16:09
    62
    你们拿到就用的吗?没有全局的 agents.md ?我都是写了一堆约束的。例如,写 docblock ,不要兜底,需求要反复确认后给出计划。

    虽然还是时不时会抽风,但要比不加约束好很多。
  • 1874w 07-03 16:13
    63
    @smileeast 可以,我试试你这个。我目前 Token 比较充足,所以还在用,只不过很少用它来走完整流程。
  • Jamieyang 07-03 16:23
    64
    个人感觉

    智商:GPT > Claude
    写代码: GPT > Claude
    Review: GPT > Claude
    灵性:Claude > GPT
    业务理解/认知:Claude > GPT
    运维能力:Claude > GPT

    只能说各有长处,使用场景不一样。GPT 合适纯后端,Claude 合适 DevOps 这种跨界工种
* 帖子来源V2EX
返回