为啥gpt-image-2在web端效果吊打codex端?

杰洛·齐贝林 2026-06-30 13:20 1

正价自购plus

用 GPT Image 2 生成图片,Web 端和 Codex 端的效果完全是一个天上一个地下

Web 端在整体的信息量细节丰富程度排版等评判标准上,完全断崖式领先 Codex 端

不知道是不是用法上有什么问题,看看其它佬有什么经验


补充: 没用API是因为api是独立于订阅之外的,要单独收费,web和codex都是在套餐里面的


具体测试过程:

web端:5.5,高级,图像生成模式


codex端:5.5,xhigh,Image gen模式


效果对比:

web:


codex:


可见codex这边差了不是一点半点

我经常用gpt来做宣传海报、DM单,codex端这个效果完全就是不可用的水平


共同的提示词:



{“subject”:{“描述”:“电影级日系写真封面风格,动态姿态;保留真实人类面部质感;呈现高级时尚写真与亲密氛围感”},“style”:{“风格”:“高端日系杂志封面风”,“特征”:[“商业摄影质感”,“高密度封面排版”,“高级氛围感”,“高光泽肌肤”,“高对比度电影色彩”]},“model”:{“身材”:“8.5头身超模比例,优雅S曲线”,“皮肤”:“自然微光泽肌肤,真实毛孔与细腻质感”,“特征”:[“精致锁骨与肩颈线条”,“自然女性魅力”,“时尚写真气质”]},“face”:{“基础”:“日系电影感脸型”,“细节”:[“微醺感眼神”,“自然水润唇妆”,“轻微红晕”,“电影级眼部高光”]},“pose”:{“姿态”:[“舒展自然的身体语言”,“恋人视角氛围感”,“轻抚发丝或衣领”]},“hair”:{“描述”:“真实沙龙级发型,轻微凌乱感”,“特征”:[“符合重力感”,“自然碎发”,“背光增强发丝层次”]},“costume”:{“描述”:“高级定制时尚服装”,“特征”:[“贴合身体曲线”,“轻微解构设计”,“高级面料质感”]},“environment”:{“场景”:“高级酒店套房或私密休息室”,“风格”:[“电影级布景”,“轻雾氛围”,“散景效果”,“暖冷对比灯光”]},“composition”:{“构图”:[“竖版 2:3”,“大特写到中景”,“极浅景深”,“杂志封面式文字布局”]},“lighting”:{“灯光”:[“电影级商业布光”,“暖色主光突出肤色”,“冷色环境光”,“轮廓光强化边缘”]},“typography”:{“风格”:[“日文主标题”,“英文字体混排”,“高级杂志封面设计”,“极细衬线字体”]},“mood”:{“氛围”:[“梦幻”,“暧昧张力”,“亲密感”,“电影感”]},“negative”:{“避免”:[“低质量”,“过度锐化”,“文字重复”,“发光描边”,“低分辨率”]},“aspect_ratio”:“2:3”}


最新回复 (16)
  • Revisit 06-30 13:27
    2

    主观谈论客观吧.我怎么觉得你是在说越擦边越可用呢?你也完全可以指挥codex利用api curl去请求生成这张图片.并把过程显示出来给你结果来对比嘛. ^-^

    再不行你给用postman啥的把你web的请求整个拿出来.让codex再发一次呢? ^-^

  • 杰洛·齐贝林 楼主 06-30 13:29
    3

    不是擦边,是整体的文字排版和文字的精细程度。

    早上在论坛里看到的另外一个大佬的提示词。因为它是生成杂志封面风的,我就随手拿来用了


    不用 API 的原因,在一开始也说了,API 是要单独计费的。


    我之前在论坛里面搜索了一下,大家都是直接在 Codex 里面。我看很多人就直接在 Codex 里面生成,我之前也是,就觉得效果不尽人意。然后想到用 Web 版试了一下,结果发现效果很惊艳。完全不是一个档的

  • 杰洛·齐贝林 楼主 06-30 13:30
    4

    倒是看到有另外一个方法,就是有人说可以把账号反代到 CPA 里面,用 CPA 来请求 Image2。但这应该不算 API 的方式,而且我也没搞反代,所以说就没这么尝试

  • Revisit 06-30 13:31
    5

    我的意思是.不论他是web.还是codex还是app.实际数据就是通过tcp/udp/socks5传输的.你可以拿不同的原始请求去尝试.

  • Revisit 06-30 13:34
    6

    这个没法啊.毕竟生成的质量.是一个主观判断啊.你个人认为web好.codex差.可能别人反过来.你要得出实际结论.就需要不同场景的下的大量样本和大量的主观得到基本客观的结果嘛

  • 柔情似水 06-30 13:40
    7

    web端有提示词工程,官方内置的。就像同样的话发到web端与api端,回复的内容相差很大

  • lueluelue 06-30 13:42
    8

    网页版会重写提示词吧?这是 pro 的






  • Soul 06-30 13:42
    9

    {“subject”:{“描述”:“电影级日系写真封面风格,动态姿态;保留真实人类面部质感;呈现高级时尚写真与亲密氛围感”},“style”:{“风格”:“高端日系杂志封面风”,“特征”:[“商业摄影质感”,“高密度封面排版”,“高级氛围感”,“高光泽肌肤”,“高对比度电影色彩”]},“model”:{“身材”:“8.5头身超模比例,优雅S曲线”,“皮肤”:“自然微光泽肌肤,真实毛孔与细腻质感”,“特征”:[“精致锁骨与肩颈线条”,“自然女性魅力”,“时尚写真气质”]},“face”:{“基础”:“日系电影感脸型”,“细节”:[“微醺感眼神”,“自然水润唇妆”,“轻微红晕”,“电影级眼部高光”]},“pose”:{“姿态”:[“舒展自然的身体语言”,“恋人视角氛围感”,“轻抚发丝或衣领”]},“hair”:{“描述”:“真实沙龙级发型,轻微凌乱感”,“特征”:[“符合重力感”,“自然碎发”,“背光增强发丝层次”]},“costume”:{“描述”:“高级定制时尚服装”,“特征”:[“贴合身体曲线”,“轻微解构设计”,“高级面料质感”]},“environment”:{“场景”:“高级酒店套房或私密休息室”,“风格”:[“电影级布景”,“轻雾氛围”,“散景效果”,“暖冷对比灯光”]},“composition”:{“构图”:[“竖版 2:3”,“大特写到中景”,“极浅景深”,“杂志封面式文字布局”]},“lighting”:{“灯光”:[“电影级商业布光”,“暖色主光突出肤色”,“冷色环境光”,“轮廓光强化边缘”]},“typography”:{“风格”:[“日文主标题”,“英文字体混排”,“高级杂志封面设计”,“极细衬线字体”]},“mood”:{“氛围”:[“梦幻”,“暧昧张力”,“亲密感”,“电影感”]},“negative”:{“避免”:[“低质量”,“过度锐化”,“文字重复”,“发光描边”,“低分辨率”]},“aspect_ratio”:“2:3”}



    codex端怎么调用image2啊 直接把提示词给他吗 但是好像不会选择用这个模型 要么是python一些图随便糊弄一下

  • 杰洛·齐贝林 楼主 06-30 13:44
    10

    对于个人来说,肯定没法像研究机构那样,完全定性定量地进行大量的测试。

    但是只要使用过一段时间,在不同的场景下生成了几十张图,就足够产生非常显著的一个判断了

    我这个帖子只是举了个例子。我在平时日常使用中,主要就是生成海报这个使用场景,Codex端这边细节和信息量差太多了,同样提示词


    我当然知道这里面可以做很多后续的优化工作,我只是说在什么额外工作都不做的前提下,就最裸的请求,两者差异就已经很大了

  • Revisit 06-30 13:44
    11

    你完全可以叫他写一个api调按.找一下你在web的授权信息.然后把提示词给他.

    甚至你直接说.“我感觉你生成的不如web端好.你先看看web是怎么调用生图功能的.写一个脚本我给你token等.你来调用”.他就会来事了

  • 杰洛·齐贝林 楼主 06-30 13:45
    12

    我也是这么觉得的,在什么额外工作都不做的情况下,相同的提示词,就光是裸的请求,web端生成的效果就要好很多

  • 杰洛·齐贝林 楼主 06-30 13:47
    13

    我调查了下

    codex是在输入提示词的时候,要让它使用image gen这个skill



    然后这个 skills 的内容

    会让它调用 内置 image_gen 工具,但这个工具是个黑盒

    可以仔细看一下 skills 的内容。它里面写了这个工具如果是主要调用方式,还有一个兜底调用方式是使用内置的 scripts/image_gen.py,里面明确写了用gpt-image-2这个模型id

    所以image_gen这个tool估计应该也是调用的gpt-image-2

  • Revisit 06-30 13:47
    14

    我的意思是.这始终是个人的主观判断.

    因为你所有的"不同端"都只是一个壳子.核心都是调用gpt-images2这个模型.

    不是codex也不是web的问题.你完全可以调整你在所谓的不同"端"的内容去调它. ^-^

  • Revisit 06-30 13:50
    15

    如果又回到了你觉得什么都不做web端好的说法.那肯定也有人说codex好啊.你说是不.佬 ^-^

  • 杰洛·齐贝林 楼主 06-30 13:52
    16

    可能你误解了我的意思,你看我这个帖子的标题就叫做"web端和codex端的差异"

    我自始至终都没讨论模型本身,而是这两个壳子的差异

    我当然完全可以用 API 围绕着提示词、skills、相关harness 做一个自己的 shell,来调用 GPT-Image-2 模型,达成最符合自己的一个用法

    但这偏题了,不是吗

    我自始至终讨论的都是这两个壳子最原本的差异


    发这个帖子本身就是想看一下其他人的使用体验。看到上面有几个佬的回复,我基本上心里已经有数了。

  • Revisit 06-30 13:53
    17

    是啊.但这还是在你的主观判断啊.如果你觉得web好.那就肯定是web好啊.没有讨论的必要啊.佬 ^-^

* 帖子来源Linux.do
返回