AI时代 所有开源的代码都变成了训练饲料

5080 2026-07-05 03:49 1

你公司有个内部PHP工具库,用了GPL协议,专门处理支付签名。某天你发现Copilot在你同事的编辑器里,直接补全了一段和这个库几乎一模一样的签名生成函数——包括你当年写的那个奇葩变量名 $weixin_sign_salt_2020。


问题来了:


Copilot的训练数据里确实包含公开的GPL代码


但你同事在用Copilot写闭源商业项目


按GPL要求,这段代码的“衍生作品”必须开源


微软说“这是AI生成的新代码,不算衍生”


你打开PR,发现这段代码和你三年前写的,就差一个空格


^-^ ^-^

最新回复 (5)
  • MoeXia 07-05 03:52
    1

    想起来之前Copilot补全,把一个开源库里一个老哥写的脏话注释都给补全过来了 ^-^

  • sgfox 07-05 03:52
    2

    要求AI生成的代码必须开源就好了,很合理不是吗?AI本身就是在整理数据,当然得开源

  • 5080 楼主 07-05 03:52
    3

    @MoeXia #1 xs

  • gemdzq 07-05 05:17
    4

    @sgfox #2 那你不是在整理26个字母吗

  • -- 07-05 10:59
    5

    @gemdzq #4 卧槽,经典,不过还有标点符号。

* 帖子来源NodeSeek
返回