细节是可以堆钱或者996得到
知道用chain of thought是至关紧要的
版主: verdelite, TheMatrix
套壳的意思应该是比如你发个问题给Deepseek,它直接把问题发给ChatGPT,从ChatGPT取得答案之后再发回给你,假装是它自己的回答。
TheMatrix 写了: 2025年 1月 30日 15:48 套壳的意思应该是比如你发个问题给Deepseek,它直接把问题发给ChatGPT,从ChatGPT取得答案之后再发回给你,假装是它自己的回答。
Deepseek不是这种情况。首先这一点要搞清楚。
数据蒸馏最合适的类比应该是这样:
ChatGPT相当于一个学科的开创人,它没有任何书可以学习,一切都是从原始资料里总结。它总结了之后写成了一本书,里面都是精炼的知识。DeepSeek相当于从这本书开始学习。学完了之后,两个模型都是回答实际问题,新问题,而不是回答书里的问题。两个模型回答得一样好。
借用@verdelite的话,从书里学,和自己悟,学的一样好。