agent算法/后训练算法怎么选和学

libz 2026-06-28 15:28 1

本人马上研二了,研一是研究知识图谱方向的,现在有一篇知识图谱相关论文在投,后续就业打算转向后训练或者agent算法,尽量往算法方向靠,现在也不知道要怎么学。

个人学习情况:llm基础知识是了解的,包括微调和强化的一些基础理论知识都有了解,但是没动手训过模型,组内可用一张5880和三张4090D。agent的话只是平时会用claude和codex,深入一点的一些记忆,规划机制什么的就不太了解了,只知道mcp协议和tool use和一些rag相关的知识。

想请教佬们后续就业是偏向后训练好还是agent算法好,在我的理解里agent算法其实也涉及到后训练优化吧,然后就是想知道选择了之后具体怎么学好,有没有什么学习资料,开源项目,视频资料和论文之类的资源推荐,如果有学习路线就更好了。

最新回复 (2)
  • Polaris_Sun 06-28 16:21
    1

    要我觉得,agent算法好一些,后训练去年下半年还挺火的,但是现在感觉不太行了,我的理解是目前基模的能力已经上去了,好的基模+harness/agent调度,基本上已经满足要求了,而且后训练还得搞数据集啥的,感觉目前公司可能就不太喜欢了

    而且后训练目前卷的飞起,我也是搞知识图谱的,我看我同门搞了1篇CVPR finding 两篇ACL finding,N个B会C会,都进不去后训练组,估计得2-3篇A会顶会才能进了,agent算法要好一些,因为更偏应用一些,agent算法确实会涉及一点后训练,所以我的理解当中微调和强化学习也得会,但是不需要那么精通,只需要会train模型就行

    学习资料的话,我目前也比较发愁,没找到什么比较好的,感觉可以自己先搞一个小的rag项目,然后再看看目前的codex/claude code的东西,然后慢慢往上加就行,我目前是这么干的


    PS:后训练大概率卡双九科班+2-3篇A

  • libz 楼主 06-28 18:38
    2

    我也觉得agent算法门槛低一点,还是不知道怎么入手,佬有什么推荐吗。

* 帖子来源Linux.do
返回