真的没人觉得 codex 比 claude 笨很多吗？

linbenyi 07-02 19:02

1楼

可能也是定价的底气吧。

allgy 07-02 19:09

2楼

还行啊，约束条件给得多，codex 也能变 claude

hengxiangbianhua 07-02 19:25

3楼

我也觉得 codex 不太行，现在各种模型价格差不了多少，能力确实天差地别

billccn 07-02 19:25

4楼

这两家同档次的模型实际能力差不多，但是系统提示词的优化方向不一样。建议你的偏好写到你的 AI 工具的自定义提示词里面。

另外我记得两家的系统提示词都有避免向用户确认、尽量猜测用户意图的指示。这应该是想避免对话频繁中断浪费导致上下文被踢出缓存。你需要确认的话就自定义呗。

banricho 07-02 19:32

5楼

不觉得，持续优化项目的 AGENTS.md ，一次性把话说清楚最重要

chengkai1853 07-02 19:33

6楼

和你感觉相反，Codex 比 Claude 细致太多了

niubee1 07-02 19:36

7楼

感觉现在有些人动辄非 Claude 不能干活，我就怀疑你是搞什么外星科技呢，离开 Claude 你就是个瘸子了？不会干活了？

lightryanking 07-02 19:48

8楼

一起用 codex5.5 fable 都很好；

谷歌 gemini 啥的就拉跨了

yzw7489757 07-02 19:50

9楼

电油之争？别比谁最好，差的是使用习惯和姿势。

相反，我觉得 codex 比 claude 更好操作，边界也相对可控。

noahliaszn 07-02 19:54

10楼

都差不多 claude 爱说废话, codex 喜欢很快就开始干写一堆没用的 helper
2 个一起用一个做 plan 一个做 execute

lianyue 07-02 20:02

11楼

codex 很喜欢自己写代码都不知道用依赖不知道去找 github
然后代码很乱真的很乱功能文件输入输出接口等都不清晰代码到处放
连 cursor 的 auto 都不如真的结构性一点都不如他
但是基础功没问题缺调教 AGENTS.md 要约束的规则偏多很多
吧 AGENTS.md 写好
我觉得边界会很清晰
现在我 AGENTS.md 强制了 4 个文档
TESTING.md README.md FLOW.mmd AGENTS.md
叫他动手之前有必看
并且前三个文档是必须的改动了必须对齐尤其是 flow.mmd 流程图基本我不看内部代码只看流程图+ 输入输出接口和输入输出约束就行了

yzw7489757 07-02 20:04

12楼

楼上，一堆错别字...

canyue7897 07-02 20:06

13楼

跟楼主相反
codex 是唯一一个能严格按照我的要求干完活儿的
其余的或多或少都会偷懒

ebushicao 07-02 20:11

14楼

Codex 最近确实很笨，降智严重。不过一行注释不写不是什么问题吧，vibe coding 没注释更好吧，agent 自己去看代码比被注释带偏好多了

kuhung 07-02 20:15

15楼

Codex 比较喜欢写防御性编程，生成一大堆假设。

Cloudiver 07-02 20:39

16楼

@chengkai1853 同意，claude 虽然落地快，但 bug 很多。GPT 相对严谨、细心很多

Jamieyang 07-02 20:52

17楼

Codex 不是蠢，是懒。比 Claude 更懒就用得更累

zuosiruan 07-02 20:54

18楼

@chengkai1853 +1 codex 很多时候考虑的比 claude 要好的多，尤其是和 opus4.8 比

wolfie 07-02 21:22

19楼

gpt-5.4/5.5 指令依从度太差，而且经常丢上下文。

PerFectTime 07-02 21:23

20楼

有什么好争的, 我觉得是人的问题

little_cup 07-02 21:40

21楼

我的感受是，Codex 系列更适合于依据长文档进行开发； Claude 系列更适合许愿式开发。
当然，Fable 5 确实是目前综合性能最强的。Codex 老爱写过度的防御式编程。但是同样价格，Codex 量实在多太多了。

wonderfulcxm 07-02 21:45

22楼

@lianyue codex 写代码不是项目决定的吗？相反，我觉得 codex 很爱参考代码，比如写一个 wordpress 插件，它会参考我之前写的插件，结构和代码风格保持高度一致。

HappyAndSmile 07-02 21:53

23楼

codex 确实是比 Claude code 差很多的，只能通过建立自己的经验.md ，让它弥补自身的缺陷

v2gba 07-02 21:55

24楼

opus 也傻逼

只是 fable 暂时独一档而已看看 5.6 吧

fovecifer 07-02 22:16

25楼

GPT5.5 目前写代码是性价比最高的
Opus 比较适合做架构之类的工作

KING754 07-02 22:47

26楼

真的没有人用 cursor 吗？
量大，各种模型可以随心所欲。
可视化 UI ，操作简单。

zhuang0718 07-02 22:50

27楼

主要是最近降智的原因吧

noqwerty 07-02 23:01

28楼

叽里咕噜说啥呢，反正都比我聪明多了

ifconfig 07-03 00:49

29楼

codex:现在重跑同一个 suite ，看 10 个测试是否全部通过，尤其是刚才红的那条

DefoliationM 07-03 01:29

30楼

不觉得，挺好用的，不过写前端不咋地，后端完全按照我的要求来。

1874w 07-03 03:38

31楼

我个人觉得大部分是人的问题.

如果始终是许愿式开发.评价体系为 AI 能一次猜到你想的 = 聪明,猜不到 = 不聪明

那任何模型应该都存在这个问题,除非他能接你的脑机接口,知道你脑子里的全部上下文

而且由于变量的不同,会有一些可能存在的错误判断.

比如在 Claude 中聊问题 A, 发现他能很快明白你的描述,解决你的问题.

后面换到到 Codex 时,聊的是问题 B,但是他没能立马明白你的描述,得聊多轮才能解决你的问题

所以得出的结论: Claude 比 Codex 聪明.或者 Codex 降智严重

但实际上有可能同样的提示词放到 Claude 中也未必能立马解决问题 B

==========================================================

所以我个人感觉许愿式开发,总的来说是不稳定的,除了模型本身的能力是一个影响因素外,一个相对稳定的工作流是很重要的, 最重要的就是得让 AI 知道你当前问题的足够上下文.

理论来说用能力相对低一些的模型 + 稳定工作流也能解决你的问题.

superpowers 的 Brainstorming SKILL 本身的设计理念,就大概是这个意思. 当然毕竟它比较重和费 Token,不是所有问题都得用 superpowers 来解决.

所以 AGENTS.md/CLAUDE.md 和一些你本地的文档,都是非常重要的上下文.

我日常使用时,基本都会让 AI 把稳定的流程固定成本地文档.

例如和他聊完当前项目是怎么部署的,怎么修 bug 的,项目的架构等等文档,都可以在聊完之后让他沉淀成固定文档.下次让他读这些文档就知道怎么开始了.

之前在 X 上也看到一个方法论:

在和 AI 聊完和并改完 BUG 之后,可以再最后问 AI 一句: 如果回到一开始,我该怎么和你描述,你才能一次性解决这个问题

感觉可以试试,也能学习到该如何和 AI 进行交流

germain 07-03 03:43

32楼

这个行业已经从单纯的歧视印度程序员沦落到了歧视 Codex 了。很多人都不曾问过自己，如果现在失业去面试，自己在面试桌上是个什么样的角色。

1874w 07-03 03:45

33楼

@1874w 如果这些本地文档不想提交到远端仓库或者污染提交历史,可以参考我的这篇博客来设置 git 忽略

这样 Vibe Coing 过程中产生的项目本地文档, 甚至可以放更多私人流程和信息,而不用考虑会被 AI 提交到远端仓库

https://blog.1874.cool/vibe-coding-mid-doc

1874w 07-03 04:00

34楼

@little_cup 我感觉你可以总结下他的过度的防御式编程规则,然后把不想要的规则写进本地文档,然后在一开始聊天时让他读一下,放到上下文应该能解决一部分

Yasuke 07-03 08:49

35楼

反正我两个都用，codex 比 cc 好多了，就是 codex 写 ui 简直让人眼前一黑

nVic 07-03 08:50

36楼

他俩严格来说不是一类工具。

coreJK 07-03 08:53

37楼

@KING754 #26 之前用得多，但是 cursor 动不动就没响应了

mywind 07-03 09:05

38楼

我感觉可能和上下文信息有关，如果一个工具用久了，积累了相对多的上下文信息，用起来就会顺手很多，这时候再用另一个就会感觉不太顺手。
我个人用 Codex 多一下，个人的感受 Codex 相对细致，但也更循规蹈矩，Claude 对一些开放性问题会相对有洞察一些，但是也喜欢自嗨。两个都不能突破使用者本身能力的上限，会逐渐适配出一套看着好像是那么回事并且讨喜的回答模式。

Meteora626 07-03 09:17

39楼

codex 上下文管理一绝好吧，远程压缩一个上下文记录好多东西和大模型压缩一个天一个地

nebulabox 07-03 09:25

40楼

和你感觉相反，Codex 比 Claude 好用

potatowish 07-03 09:27

41楼

codex 就是缺少一点灵性。写代码比较死板，严谨过头，它甚至改个注释都要给我重新编译一遍。

houOne 07-03 09:44

42楼

codex 比我聪明很多，就挺好的。我也想用 claude 用不上~

NASK 07-03 09:59

43楼

首先确认一下你的 codex 推理等级是不是 xhigh

Mandelo 07-03 10:01

44楼

但是奥特曼不封号

Bluecoda 07-03 10:07

45楼

并没有，只要 context 足够小，足够窄，并不觉得 codex 比 cc 差多少

malatang 07-03 10:12

46楼

没有啊

hengxiangbianhua 07-03 10:16

47楼

@NASK 我觉得 xhigh 反而不好

rb6221 07-03 10:16

48楼

都别吵了，大家一样烂，要我说最强的还得是古法编程[doge]

NullIsLife 07-03 10:21

49楼

能畅饮 cc 的会用 codex 吗

clemente 07-03 11:09

50楼

@NullIsLife 我都用啊

lovelyidiot 07-03 11:31

51楼

codex 65 分，claude 75 分，差不多就这样。前者比一半以上人强，后者比 3/4 以上人强。65 分就是有经验、能做，做的也就那样，没新意。75 分就是能做，明显比大部分人做的更好，但做不了 85 分人能做到的程度。

bojue 07-03 11:36

52楼

@lightryanking 北美豆包

keenkiller 07-03 12:07

53楼

codex 确实不写注释，你要跟他说他才会补

fatigue 07-03 12:17

54楼

恰恰相反，claude 一个对话刚开始还好，用着用着就开始退化，最后会困在某个点死活出不来，codex 整体性要好很多，很少会卡住

Isuxiz 07-03 13:39

55楼

codex 现在有个 bug ，症状是固定 516 reasoning token ，体验就是模型降智很厉害
https://github.com/openai/codex/issues/30364
等修复吧

ooppstef 07-03 13:46

56楼

我的天？居然会有人觉得 claude 比 gpt 强？推理能力完全不在一个层级好吧。。。疯了，当然 gpt 的前端能力很弱，这个 gpt 自己也承认，但推理，review ，找 bug ，写代码的严谨性，把 claude 吊起来打啊。

不过降智了，就没什么好聊的。。。

NullIsLife 07-03 14:04

57楼

@clemente #50 能说说在畅饮 cc 的情况下，什么场景你会想用 codex

diaoyulao9657 07-03 15:12

58楼

两个都在用，Claude code 适合当军师，Codex 适合干苦力，一个出谋划策做监工，一个猛猛干

xidaduo 07-03 15:23

59楼

Claude 在出方案和产品思路方面比 Codex 好太多，Codex 干有详细文档和计划的活比较稳定，在执行层面比较靠谱。一个胜在创新想法，一个胜在干活稳定、使用也更稳定

MuyuQ 07-03 15:26

60楼

我的 codex 会写一大堆单元测试。。有时候我不得不中断他的任务，告诉他别写那么多，费的是我的 token 。

smileeast 07-03 15:39

61楼

@1874w #31 superpowers 这个太费 token 了，我现在用 https://github.com/mattpocock/skills 这个 skill ，这个 skill 的一个 grill-me 就是解决沟通的问题。如果能和 AI 能把事情沟通明白了，那么人际沟通这一块也会强很多。我们想的>我们表达的>对方想的>对方执行，这是四个层级，很多人想的是直接从我想的就变成执行层，这明显是有问题的。

elevioux 07-03 16:09

62楼

你们拿到就用的吗？没有全局的 agents.md ？我都是写了一堆约束的。例如，写 docblock ，不要兜底，需求要反复确认后给出计划。

虽然还是时不时会抽风，但要比不加约束好很多。

1874w 07-03 16:13

63楼

@smileeast 可以，我试试你这个。我目前 Token 比较充足，所以还在用，只不过很少用它来走完整流程。

Jamieyang 07-03 16:23

64楼

个人感觉

智商：GPT > Claude
写代码: GPT > Claude
Review: GPT > Claude
灵性：Claude > GPT
业务理解/认知：Claude > GPT
运维能力：Claude > GPT

只能说各有长处，使用场景不一样。GPT 合适纯后端，Claude 合适 DevOps 这种跨界工种

yaocy