帖子
由 magagop楼主 »
加拿大阿爾伯塔省立大學畢業博士AlphaGo大牛David Silver的強化學習課裡面講到結合model based和model free reinforcement learning,我怎麼感覺model free learning from simulated experience samples就是人類在夢境中繼續學習?跟Dyna-2一樣,長期記憶就是真實體驗,短期記憶就是夢境?這裡有腦神經專業人士懂嗎?
https://citeseerx.ist.psu.edu/document? ... aaccfd73d4
上次由 magagop 在 2025年 7月 12日 03:44 修改。