WSJ, deep Seek 成功的秘密
版主: Softfist
#1 WSJ, deep Seek 成功的秘密
今年 3 月,4 名来自deep seek的中国工程师从北京飞往马来西亚,每人携带装有 15 块硬盘的行李箱,总计 80TB 的 AI 训练数据。他们在马来西亚数据中心租用了约 300 台配备先进 Nvidia 芯片的服务器,现场训练 AI 模型后带回国内。
自 2022 年美国收紧对华 AI 芯片出口以来,中国公司发展出多种应对策略:使用国产芯片替代、通过第三国走私硬件,以及将数据转移至海外使用美国芯片。随着走私渠道收紧,「数据出海」成为新选择。
这种操作模式经过精心规划:中国工程师提前 8 周优化数据集,通过新加坡子公司在马来西亚注册实体,聘请当地董事降低审查风险。为避免海关怀疑,硬盘分装四个行李箱携带。完成训练后,工程师携带数百 GB 的模型参数返回中国。
自 2022 年美国收紧对华 AI 芯片出口以来,中国公司发展出多种应对策略:使用国产芯片替代、通过第三国走私硬件,以及将数据转移至海外使用美国芯片。随着走私渠道收紧,「数据出海」成为新选择。
这种操作模式经过精心规划:中国工程师提前 8 周优化数据集,通过新加坡子公司在马来西亚注册实体,聘请当地董事降低审查风险。为避免海关怀疑,硬盘分装四个行李箱携带。完成训练后,工程师携带数百 GB 的模型参数返回中国。
#5 Re: WSJ, deep Seek 成功的秘密
这不是很正常吗
实际上,中国公司在中东,东南亚成立公司,租用云设施,然后把算力租给AI公司,
整篇文章说得最重要的就是,用80TB的数据,炼出来800GB的大模型,压缩了100倍
实际上,中国公司在中东,东南亚成立公司,租用云设施,然后把算力租给AI公司,
整篇文章说得最重要的就是,用80TB的数据,炼出来800GB的大模型,压缩了100倍
xiaxia 写了: 2025年 6月 13日 12:24 今年 3 月,4 名来自deep seek的中国工程师从北京飞往马来西亚,每人携带装有 15 块硬盘的行李箱,总计 80TB 的 AI 训练数据。他们在马来西亚数据中心租用了约 300 台配备先进 Nvidia 芯片的服务器,现场训练 AI 模型后带回国内。
自 2022 年美国收紧对华 AI 芯片出口以来,中国公司发展出多种应对策略:使用国产芯片替代、通过第三国走私硬件,以及将数据转移至海外使用美国芯片。随着走私渠道收紧,「数据出海」成为新选择。
这种操作模式经过精心规划:中国工程师提前 8 周优化数据集,通过新加坡子公司在马来西亚注册实体,聘请当地董事降低审查风险。为避免海关怀疑,硬盘分装四个行李箱携带。完成训练后,工程师携带数百 GB 的模型参数返回中国。
#8 Re: WSJ, deep Seek 成功的秘密
核心观点是DS也是拿NVDA高端芯片训练的,大家冲鸭接着买NVDA
midlander 写了: 2025年 6月 13日 12:44 这不是很正常吗
实际上,中国公司在中东,东南亚成立公司,租用云设施,然后把算力租给AI公司,
整篇文章说得最重要的就是,用80TB的数据,炼出来800GB的大模型,压缩了100倍
#9 Re: WSJ, deep Seek 成功的秘密
以后该写偷运稀土的故事了吧
Hard times create strong men. Strong men create good times. Good times create weak men. And, weak men create hard times.