自己玩DSR1我建议弄14b参数的模型

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#21 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

Pegasi 写了: 2025年 1月 29日 23:44 14B 4090显存不够吧
完全够 我都可以在3090/24G上跑32b呢

标签/Tags:
头像
Pegasi
见习点评
见习点评
帖子互动: 71
帖子: 1250
注册时间: 2022年 10月 22日 12:50

#22 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 Pegasi »

huangchong 写了: 2025年 1月 30日 17:14 完全够 我都可以在3090/24G上跑32b呢
换成4bit跑起来了
头像
Pegasi
见习点评
见习点评
帖子互动: 71
帖子: 1250
注册时间: 2022年 10月 22日 12:50

#23 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 Pegasi »

huangchong 写了: 2025年 1月 30日 17:14 完全够 我都可以在3090/24G上跑32b呢
huangchong 你下的哪个?
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#24 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

(ヅ) 写了: 2025年 1月 29日 04:32 这个东西可以直接接入vscode,替代cursor/windsurf,还蛮好用

术版有讨论怎么配置
哪个模型优化过Coding?
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 544
帖子: 11677
注册时间: 2022年 8月 21日 14:20

#25 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

wass 写了: 2025年 2月 1日 13:08 哪个模型优化过Coding?
Claude
头像
dramawatcher1(狗蛋大)
论坛精英
论坛精英
dramawatcher1 的博客
帖子互动: 201
帖子: 8087
注册时间: 2022年 7月 25日 13:14

#26 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 dramawatcher1(狗蛋大) »

我两块显卡。显存一块11gb 一块8gb。
用 14b , 100%的 GPU
用 32b , 30%/70% 的 CPU/GPU
用 70b , 100% 的 CPU

32b 和 70b 的时候,两块显卡显存占用率都是 80%
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#27 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

(ヅ) 写了: 2025年 2月 1日 14:02Claude
我是问ds的有没有哪个模型优化过Coding

Claude经常在vs code里面用。如果ds可以,就省钱了 :D
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#28 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

我试了dsr1 8b,在4060上很快。速度跟copilot差不多
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#30 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

Pegasi 写了: 2025年 1月 31日 12:33 huangchong 你下的哪个?
@Pegasi
我下了好几个。如果显卡有8G显存,建议先试试 qwen-7b
上次由 huangchong 在 2025年 2月 1日 17:50 修改。
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#31 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

wass 写了: 2025年 2月 1日 13:08 哪个模型优化过Coding?
模型名字里带code/coding的应该都是
vscode有个continue插件,可以用本地模型,我们关于它的讨论在joke版精华区
这个continue插件推荐用codellama当编程的聊天ai。我试了一下,DS各种distill版本也都不错
x1 图片
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#32 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

huangchong 写了: 2025年 2月 1日 17:43 模型名字里带code/coding的应该都是
vscode有个continue插件,可以用本地模型,我们关于它的讨论在joke版精华区
这个continue插件推荐用codellama当编程的聊天ai。我试了一下,DS各种distill版本也都不错
好,我试试continue
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#33 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

wass 写了: 2025年 2月 1日 17:53 好,我试试continue
@wass



前提是ollma在linux下正常安装(会被装成一个系统服务,systemctl 可以管理它)

代码: 全选

curl -fsSL https://ollama.com/install.sh | sh

#download deepseek-7b
ollama pull deepseek-r1:7b
不需要自己打ollama run,在continue里开始chat, 这个事件就通过ollama的网页api启动网络了。

~/.continue/config.json

代码: 全选

"models": [
    {
      "model": "deepseek-r1:7b",
      "provider": "ollama",
      "title": "deepseek-r1:7b"
    }

  ],
  "tabAutocompleteModel": {
      "model": "deepseek-r1:7b",
      "provider": "ollama",
      "title": "deepseek-r1:7b",
    "apiBase": "http://localhost:11434"
  },
tab completion我还没有试过

https://docs.continue.dev/customize/mod ... ers/ollama
上次由 huangchong 在 2025年 2月 1日 19:06 修改。
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#34 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

ollama上面的deepseek模型都是用其他小模型蒸馏deepseekR1得来的,具体是什麽看这里
https://ollama.com/library/deepseek-r1
x1 图片
anesthetic
知名作家
知名作家
帖子互动: 72
帖子: 811
注册时间: 2022年 8月 30日 01:02

#35 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 anesthetic »

huangchong 写了: 2025年 2月 1日 18:06 ollama上面的deepseek模型都是用其他小模型蒸馏deepseekR1得来的,具体是什麽看这里
https://ollama.com/library/deepseek-r1
有完整的啊,1.5-671b都有啊
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#36 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

huangchong 写了: 2025年 2月 1日 18:00 @wass



前提是ollma在linux下正常安装(会被装成一个系统服务,systemctl 可以管理它)

代码: 全选

curl -fsSL https://ollama.com/install.sh | sh

#download deepseek-7b
ollama pull deepseek-r1:7b
不需要自己打ollama run,在continue里开始chat, 这个事件就通过ollama的网页api启动网络了。

~/.continue/config.json

代码: 全选

"models": [
    {
      "model": "deepseek-r1:7b",
      "provider": "ollama",
      "title": "deepseek-r1:7b"
    }

  ],
  "tabAutocompleteModel": {
      "model": "deepseek-r1:7b",
      "provider": "ollama",
      "title": "deepseek-r1:7b"
    "apiBase": "http://localhost:11434"
  },
tab completion我还没有试过

https://docs.continue.dev/customize/mod ... ers/ollama
我用Windows,已经用ollama serve设为Service
头像
YouHi
论坛元老
论坛元老
YouHi 的博客
帖子互动: 2652
帖子: 36363
注册时间: 2022年 7月 22日 22:36

#37 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 YouHi »

裂害。
著名网友名单
🇺🇸 NC CHINESE AMERICANS FOR TRUMP 🛩️
你也是Trump U毕业的吗???
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#38 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

anesthetic 写了: 2025年 2月 1日 18:10 有完整的啊,1.5-671b都有啊
确实有 我觉得没用就自动把它从脑袋里过滤了 :D
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 699
帖子: 7137
注册时间: 2022年 7月 23日 22:13

#39 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 wass »

还有一个open source的extension,哪天读读源代码。

目前看,最好的应用,还是写代码
anesthetic
知名作家
知名作家
帖子互动: 72
帖子: 811
注册时间: 2022年 8月 30日 01:02

#40 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 anesthetic »

wass 写了: 2025年 2月 1日 18:17 我用Windows,已经用ollama serve设为Service
吧open webgui挂上,跟deepseek.com完全一样了,sb才给openai交钱,lol
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 3805
帖子: 58306
注册时间: 2022年 7月 22日 01:22

#41 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

wass 写了: 2025年 2月 1日 18:24 还有一个open source的extension,哪天读读源代码。

目前看,最好的应用,还是写代码
ollama api:

https://www.postman.com/postman-student ... a-rest-api
回复

回到 “STEM”