分页: 1 / 1

#1 在线策略蒸馏

发表于 : 2025年 10月 29日 16:57
Caravel

直接用大模型给小模型的每一个token打分

密集反馈

可以有效把大模型能力迁移到到小模型上

估计Google openai都已经用上了

他们的小模型很厉害