【开源Skill】高质量的可编辑的AIPPT生成方式

zhangkay 2026-07-02 12:39 1

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:



  • 我的帖子已经打上 开源推广 标签:

  • 我的开源项目完整开源,无未开源部分:

  • 我的开源项目已链接认可 LINUX DO 社区:

  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:

  • 以上选择我承诺是永久有效的,接受社区和佬友监督:


以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出




项目地址:


https://github.com/ilioner/ppt-craft-editable


ppt-craft-editable 是基于NyxTide大佬的ppt-image-first 的二次扩展(原贴:https://linux.do/t/topic/2059034)


起因:我是一名教育行业工作者,课件ppt是一个很常见的东西,我寻找过很多有关ppt的skill,mcp,还有其他付费的,或者开源的框架,这些都有一些相似的问题,模板固定,规整但死板,要么就是一股浓浓的h5风格,能用,但是始终是牺牲了一些质量,于是偶然间看到NyxTide的思路,用了一段时间感觉不错,于是决定基于佬的技能进行二次扩展。


扩展哪些:ppt-image-first 已经很优秀了,基于编辑图片的方式生成最终图片形式的ppt视觉质量因为背靠AI所以一流 但是存在一个问题,如果后期需要对上面的文案进行编辑就很不方便了,于是我在此基础上将ppt-image-first 的最终稿件当做效果图,从而生成风格尽可能高度还原或者贴近(看模型能力)的背景,然后再让模型通过计算将文案填充至合适的位置进行渲染。


还是带着实例走一遍吧(以下在Qoderwork中完成):


前面的过程略过,从最后一步开始,最后一步完成后会询问是否要进入编辑流程:




阶段1的产物(文字无法编辑但很生动):



阶段2的过程,会有一个文字审计和背景审计的页面,可以在页面上框选。可以看出来风格相对接近你可以多次调整背景直到满意。



至于文字的样式要怎么调整,可以在最后的ppt文件中自行调整。



阶段2的过程,会有一个文字审计和背景审计的页面,可以在页面上框选。可以看出来风格相对接近你可以多次调整背景直到满意。



至于文字的样式要怎么调整,可以在最后的ppt文件中自行调整。



可能存在疑问:



  1. 为什么没有办法完全复刻阶段一的图片样式呢?答:因为和生图模型有关。

  2. 可否跳过阶段1,直接从走可编辑的路子呢?答:当然可以,你只需要给指令后面加一句,给我做成可编辑的。

  3. 其实阶段一对大部分人来说够用了如果对后续编辑要求不高的话


还想做什么?答:哪些导出的pdf格式的ppt理论上都可以编辑正在修改中。


希望大家多提供优化思路。

最新回复 (5)
  • sumuzhi 07-02 12:48
    1

    我对象也是教师,她在将练习题时需要给学生展示对应习题的ppt。这些ppt没有啥特别的地方,仅仅是ocr的图片加上一些答案,点击下一步就会展示答案。做起来很简单,但是很浪费时间,因为这些ppt没有什么特点,仅作为给学生看的ppt。我最近想着能不能用ai agent做到输入图片,到自动生成ppt,因为是语文教师,所有题目类型比较多,填字题、连线题、判断题、选择题等等,想实现的是,生成的答案也直接填在原地方,现在卡着了,生成的ppt是有了,但答案总对不上

  • BenGPT 07-02 12:50
    2

    先mark一下,回头看看,感谢^-^

  • zhangkay 楼主 07-02 13:26
    3

    这种交互式的还是web的ppt方案吧 好点的还能数据回收,或者借助不坑盒子将html内嵌刀ppt中,是一个性价比非常高的方式。 我们打比赛多数路子就是这样,很方便的

  • 树洞小兔 07-02 13:49
    4

    最近正在试用各种 PPT生成的方案,一会试下佬的。感谢

  • zhangkay 楼主 07-02 14:41
    5

    文字不太多的话需要可编辑应该还可以

* 帖子来源Linux.do
返回