agent算法/后训练算法怎么选和学

libz 2026-06-28 15:28 1

本人马上研二了，研一是研究知识图谱方向的，现在有一篇知识图谱相关论文在投，后续就业打算转向后训练或者agent算法，尽量往算法方向靠，现在也不知道要怎么学。

个人学习情况：llm基础知识是了解的，包括微调和强化的一些基础理论知识都有了解，但是没动手训过模型，组内可用一张5880和三张4090D。agent的话只是平时会用claude和codex，深入一点的一些记忆，规划机制什么的就不太了解了，只知道mcp协议和tool use和一些rag相关的知识。

想请教佬们后续就业是偏向后训练好还是agent算法好，在我的理解里agent算法其实也涉及到后训练优化吧，然后就是想知道选择了之后具体怎么学好，有没有什么学习资料，开源项目，视频资料和论文之类的资源推荐，如果有学习路线就更好了。

最新回复 (2)

Polaris_Sun 06-28 16:21

1楼

要我觉得，agent算法好一些，后训练去年下半年还挺火的，但是现在感觉不太行了，我的理解是目前基模的能力已经上去了，好的基模+harness/agent调度，基本上已经满足要求了，而且后训练还得搞数据集啥的，感觉目前公司可能就不太喜欢了

而且后训练目前卷的飞起，我也是搞知识图谱的，我看我同门搞了1篇CVPR finding 两篇ACL finding，N个B会C会，都进不去后训练组，估计得2-3篇A会顶会才能进了，agent算法要好一些，因为更偏应用一些，agent算法确实会涉及一点后训练，所以我的理解当中微调和强化学习也得会，但是不需要那么精通，只需要会train模型就行

学习资料的话，我目前也比较发愁，没找到什么比较好的，感觉可以自己先搞一个小的rag项目，然后再看看目前的codex/claude code的东西，然后慢慢往上加就行，我目前是这么干的

PS：后训练大概率卡双九科班+2-3篇A
libz 楼主 06-28 18:38

2楼

我也觉得agent算法门槛低一点，还是不知道怎么入手，佬有什么推荐吗。

* 帖子来源Linux.do

附近帖子