让ai复刻文档排版，佬友们有没有什么好办法

huann 2026-07-06 00:24 1

我是想做这样的文档，目前使用的codex+5.5，是提供了图片以后，让ai给我做完全相同样式的，但是做出来的效果很拉，要么东一个字西一个字，要么位置太集中，各个元素的位置不这么整齐，或者是布局又不行，后来我尝试让ai先做html再生成文档，效果会好点，但是还是有上面这些各种各样的问题出现，然后尝试让codex做完以后进行视觉检查，不到100%相似度就继续做，但是最终还是有各种样式的问题，目前的最优解是ai做完以后人工告诉他哪里不行，比如文字位置，元素位置，四周的间距等等，但是比如换成下图

这种其他样式或者其他科目的，就还是要重新走一遍，做成skill也是只能固定某个样式，换了以后还是出现了一开始的ai做出来并不满意的问题，请教一下各位佬有什么好的经验和技巧

最新回复 (7)

Albert 07-06 00:39

1楼

我试了一下，Gemini 就可以做到写出基础骨架，后续让它调整一下应该不成问题
kalamazoo 07-06 00:39

2楼

一般来说不都是ocr吗？核心问题在于字体对齐。我之前用paddleocr。现在在考虑换百度新的那个。
huann 楼主 07-06 00:40

3楼

谢谢佬，我傻了，思维惯性了没想到换个模型试试，一直在折腾gpt
huann 楼主 07-06 00:41

4楼

paddleocr

但是ocr对一些样式还有元素样式的，能够识别到吗，我对ocr的理解一直停留在只识别文字，我去了解一下 ^-^
Albert 07-06 00:42

5楼

客气了，先折腾折腾，哪个模型好用就用哪个
kalamazoo 07-06 00:44

6楼

元素样式确实不行。^-^。我目前算是一种组合架构。保留文字可编辑性所以用的ocr。HTML可能在混合框架确实有优势。我没考虑到。
huann 楼主 07-06 00:46

7楼

嗯呢，我是想先一模一样的做出来以后，再去实现编辑文字，比如固定下html样式了，因为之前尝试一次性描述指令，完成的质量感觉更不好

* 帖子来源Linux.do

附近帖子

↑sub2api怎么导入kiro
↑目前（2026.7）如何用美区apple id购买gpt pro？
↑今天和两个朋友讨论了一下公益站
↑咨询一下如何修改帖子，我找不到入口。
↑粉笔裁了大批老师，据说是要用ai替代
📍 让ai复刻文档排版，佬友们有没有什么好办法
↓红果短剧网页版？
↓清华大学火神队卫冕机器人足球世界杯 RoboCup 2026 Large 组冠军
↓佬们现在有没有claude充值稍微稳定点的渠道
↓GPT PRO20X 额度太多知道怎么用了。
↓一些AI的冷门小玩法，大家都知道哪些？

飞读

huann

主题数
1

帖子数
1

注册排名
3

随机推荐