分页: 1 / 1

Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 14日 23:53
windy
Ollama,用了400G的SSD做Memory cache.机器本身是4080 super, 16G的 vram, 96G的ram.

目前已经在跑。让它讲个故事,快半个小时了才think了一段。

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 00:11
majia
我也部署了DEEPSEEK 不知道是不是R1

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 00:13
robot2022
厉害啊

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 00:13
mmking
有tutorial么来一个

我角落里还有个7年前的1080台式机在吃灰🥵
windy 写了: 2025年 2月 14日 23:53 Ollama,用了400G的SSD做Memory cache.机器本身是4080 super, 16G的 vram, 96G的ram.

目前已经在跑。让它讲个故事,快半个小时了才think了一段。

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 08:29
windy
睡了一觉起来故事终于讲完了。两个半小时讲了一个小故事。0.12 token/sec.平均8秒一个单词。

这个也就是玩一下。我要经常这样跑的话,恐怕我的SSD一个月就完蛋了。

其实跑起来非常简单。到ollama.com去下一个ollama装上
打开命令行,输入ollama pull <model>
可以到ollama.com上去看有啥model 可下。比如 deepseek-r1 14b, 就用 deepseek-r1:14b.如果不选size, 这个模型又有多个size,ollama会根据你的硬件自动选一个合适的。

pull 完了用
ollama run <model> 就能跑了。如果想看有多快,加个 --verbose的选项。

对 deepseek-r1 671 b 这种内存都装不下的,要到系统设置里改一下page size.我是改成了400G,加上本来的内存和显存,显示484GB。我看了一下, 用内存最多的时候用到了416GB.


图片

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 16:39
anesthetic
windy 写了: 2025年 2月 14日 23:53 Ollama,用了400G的SSD做Memory cache.机器本身是4080 super, 16G的 vram, 96G的ram.

目前已经在跑。让它讲个故事,快半个小时了才think了一段。
ssd太垃圾了吧,俺的4x 990 raid0,13900k,集显,1T swap, 3 tokens per second

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 15日 16:40
HouseMD
目测用pcie v5 的nvme可以快10倍

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 16日 01:03
windy
我是4根RAID5. 只用了400 swap. 速度还可以了,读15000/s,写10000/s.我下次试试1T swap.

也许是我用显卡反而慢。我下次把显卡关掉单用CPU试试。
anesthetic 写了: 2025年 2月 15日 16:39 ssd太垃圾了吧,俺的4x 990 raid0,13900k,集显,1T swap, 3 tokens per second

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 16日 01:07
Miraboreasu
r1多少token的?671那个?

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 16日 18:44
windy
671的。32B的能到2-3 token/s, 14b的能有60tokens/s. Mistral-small 22b 能有45 tokens/s
Miraboreasu 写了: 2025年 2月 16日 01:07 r1多少token的?671那个?

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 16日 19:32
windy
你是怎么做到的?用Ollama吗?

我刚试了一下70b的,完全没用到SSD (我的内存是96G),也只能做到1.34 token.你的SSD再快也不可能比我的内存快吧。我的CPU是9700X.
anesthetic 写了: 2025年 2月 15日 16:39 ssd太垃圾了吧,俺的4x 990 raid0,13900k,集显,1T swap, 3 tokens per second

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 17日 01:19
anesthetic
windy 写了: 2025年 2月 16日 19:32 你是怎么做到的?用Ollama吗?

我刚试了一下70b的,完全没用到SSD (我的内存是96G),也只能做到1.34 token.你的SSD再快也不可能比我的内存快吧。我的CPU是9700X.
4xraid0 相当于ddr4 2666,不过你的最大问题是9700x。。。cpu inferences都是intel optimized。

Re: Deepseek-R1在我的普通台式机跑起来了

发表于 : 2025年 2月 17日 01:42
supercnm
你在4080 super上跑671b那个吗?那肯定慢啊

For larger models, a distributed GPU setup (e.g., NVIDIA A100 or H100 in multi-GPU configurations) is recommended due to significant VRAM requirements.

4080 super也就用来跑一下14b的