分页: 1 / 1

#1 WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:24
xiaxia
今年 3 月,4 名来自deep seek的中国工程师从北京飞往马来西亚,每人携带装有 15 块硬盘的行李箱,总计 80TB 的 AI 训练数据。他们在马来西亚数据中心租用了约 300 台配备先进 Nvidia 芯片的服务器,现场训练 AI 模型后带回国内。


自 2022 年美国收紧对华 AI 芯片出口以来,中国公司发展出多种应对策略:使用国产芯片替代、通过第三国走私硬件,以及将数据转移至海外使用美国芯片。随着走私渠道收紧,「数据出海」成为新选择。


这种操作模式经过精心规划:中国工程师提前 8 周优化数据集,通过新加坡子公司在马来西亚注册实体,聘请当地董事降低审查风险。为避免海关怀疑,硬盘分装四个行李箱携带。完成训练后,工程师携带数百 GB 的模型参数返回中国。

#2 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:30
pepper
wsj就是个间谍机构

#3 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:32
fanqie
主流媒体开始写小说了

#4 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:36
foofy
为何不通过network?

#5 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:44
midlander
这不是很正常吗

实际上,中国公司在中东,东南亚成立公司,租用云设施,然后把算力租给AI公司,

整篇文章说得最重要的就是,用80TB的数据,炼出来800GB的大模型,压缩了100倍
xiaxia 写了: 2025年 6月 13日 12:24 今年 3 月,4 名来自deep seek的中国工程师从北京飞往马来西亚,每人携带装有 15 块硬盘的行李箱,总计 80TB 的 AI 训练数据。他们在马来西亚数据中心租用了约 300 台配备先进 Nvidia 芯片的服务器,现场训练 AI 模型后带回国内。


自 2022 年美国收紧对华 AI 芯片出口以来,中国公司发展出多种应对策略:使用国产芯片替代、通过第三国走私硬件,以及将数据转移至海外使用美国芯片。随着走私渠道收紧,「数据出海」成为新选择。


这种操作模式经过精心规划:中国工程师提前 8 周优化数据集,通过新加坡子公司在马来西亚注册实体,聘请当地董事降低审查风险。为避免海关怀疑,硬盘分装四个行李箱携带。完成训练后,工程师携带数百 GB 的模型参数返回中国。

#6 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:44
midlander
foofy 写了: 2025年 6月 13日 12:36 为何不通过network?
网络传输慢

#7 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:45
foofy
midlander 写了: 2025年 6月 13日 12:44 网络传输慢
高速网络啊。你以为租用家庭套餐?

#8 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:49
flyingbeast
核心观点是DS也是拿NVDA高端芯片训练的,大家冲鸭接着买NVDA
midlander 写了: 2025年 6月 13日 12:44 这不是很正常吗

实际上,中国公司在中东,东南亚成立公司,租用云设施,然后把算力租给AI公司,

整篇文章说得最重要的就是,用80TB的数据,炼出来800GB的大模型,压缩了100倍

#9 Re: WSJ, deep Seek 成功的秘密

发表于 : 2025年 6月 13日 12:53
直接投降
以后该写偷运稀土的故事了吧