让ai复刻文档排版,佬友们有没有什么好办法

huann 2026-07-06 00:24 1



我是想做这样的文档,目前使用的codex+5.5,是提供了图片以后,让ai给我做完全相同样式的,但是做出来的效果很拉,要么东一个字西一个字,要么位置太集中,各个元素的位置不这么整齐,或者是布局又不行,后来我尝试让ai先做html再生成文档,效果会好点,但是还是有上面这些各种各样的问题出现,然后尝试让codex做完以后进行视觉检查,不到100%相似度就继续做,但是最终还是有各种样式的问题,目前的最优解是ai做完以后人工告诉他哪里不行,比如文字位置,元素位置,四周的间距等等,但是比如换成下图



这种其他样式或者其他科目的,就还是要重新走一遍,做成skill也是只能固定某个样式,换了以后还是出现了一开始的ai做出来并不满意的问题,请教一下各位佬有什么好的经验和技巧

最新回复 (7)
  • Albert 07-06 00:39
    1


    我试了一下,Gemini 就可以做到写出基础骨架,后续让它调整一下应该不成问题

  • kalamazoo 07-06 00:39
    2

    一般来说不都是ocr吗?核心问题在于字体对齐。我之前用paddleocr。现在在考虑换百度新的那个。

  • huann 楼主 07-06 00:40
    3

    谢谢佬,我傻了,思维惯性了没想到换个模型试试,一直在折腾gpt

  • huann 楼主 07-06 00:41
    4

    paddleocr



    但是ocr对一些样式还有元素样式的,能够识别到吗,我对ocr的理解一直停留在只识别文字,我去了解一下 ^-^

  • Albert 07-06 00:42
    5

    客气了,先折腾折腾,哪个模型好用就用哪个

  • kalamazoo 07-06 00:44
    6

    元素样式确实不行。^-^。我目前算是一种组合架构。保留文字可编辑性所以用的ocr。HTML可能在混合框架确实有优势。我没考虑到。

  • huann 楼主 07-06 00:46
    7

    嗯呢,我是想先一模一样的做出来以后,再去实现编辑文字,比如固定下html样式了,因为之前尝试一次性描述指令,完成的质量感觉更不好

* 帖子来源Linux.do
返回