观察者网:关键芯片领域重大突破!中国学者发布报告:在超级计算机模拟中,国产GPU性能超过英伟达芯片近10倍。美国对华不断升级的技术制裁适得其反。据悉,相关研究文章即将刊登于《水利学报》
南华早报小黄人编辑天天从中文期刊掏粪 LOL
完了,中国水利专家造GPU
版主: Softfist
#2 Re: 完了,中国水利专家造GPU
南华早报对宝书绝对忠诚
总设计师最大成就其实是:
俺为宝书抓翻墙的增国库收入:

把工人农民阶级偷偷顺利从国家主任忽悠成打工仔地位,偷偷改成资本主义
俺为宝书抓翻墙的增国库收入:
redot,UncleTony,chinaren,fulvshou,saibaster,mlforlife,SOD,matlab,F1450,becky,changjiang,midlander,DongshanGe,autoking,redcar,lahei

#3 Re: 完了,中国水利专家造GPU
中国科学家用海光7185CPU和国产GPU搭了个洪水预报模型,
在老逼将嘴里就成了中国水利专家造GPU了。
老逼将难道不知道整天这样肆无忌惮的造谣,
最终只能是适得其反吗?
https://finance.sina.com.cn/roll/2025-0 ... 6958.shtml
【文/观察者网 齐倩】今年1月,中国学者发布一项同行评议研究。该研究基于国产硬件平台研发“多节点-多GPU”大规模分布式异构并行计算水动力模型,用于流域尺度二维浅水方程高效并行求解。结果显示,在超级计算机模拟中,国产图形处理器(GPU)的性能超过英伟达芯片近10倍。
目前,这篇题为《基于国产CPU/GPU平台的水动力模型异构并行计算》的研究报告已经公开在学术平台知网。
观察者网从中国水利行业学术期刊《水利学报》了解到,相关文章即将刊登于该期刊。
“中国科学家面临的挑战更加艰巨。”《南华早报》称,在硬件方面,像A100和H100这样的先进GPU的生产由外国制造商主导。
在软件方面,总部位于美国的英伟达限制其CUDA软件生态系统在第三方硬件上运行,从而阻碍了独立算法的发展。
文章作者、河海大学长江保护与绿色发展研究院教授南统超指出,基于以上原因,
有必要基于国产CPU/GPU产业现状发展“多节点-多GPU”异构并行计算方案。
据介绍,并行计算成功的关键,在于高效的数据传输和多个节点之间的任务协调,从而最大限度地减少性能损失。
2021年,橡树岭国家实验室的研究人员使用Summit超级计算机推出了一种名为TRITON的“多节点-多GPU”洪水预报模型。
尽管部署了64个节点,但TRITON的处理速度仅提高了约6倍。
相比之下,南统超团队提出一种创新架构,将多个GPU合并到单个节点中,以抵消国内硬件的性能限制。
通过在软件级别改进节点之间的数据交换,他的模型大大减少了通信开销。
文章提到,该模型建立在国产通用的x86计算平台上,CPU为国产海光7185处理器,32核64线程,主频2.5GHz,
GPU也是国产的,支持128GB内存,网络带宽200Gb/s。新模型仅使用7个节点就实现了6倍的加速,比TRITON使用的数量少了约89%。
在老逼将嘴里就成了中国水利专家造GPU了。
老逼将难道不知道整天这样肆无忌惮的造谣,
最终只能是适得其反吗?
https://finance.sina.com.cn/roll/2025-0 ... 6958.shtml
【文/观察者网 齐倩】今年1月,中国学者发布一项同行评议研究。该研究基于国产硬件平台研发“多节点-多GPU”大规模分布式异构并行计算水动力模型,用于流域尺度二维浅水方程高效并行求解。结果显示,在超级计算机模拟中,国产图形处理器(GPU)的性能超过英伟达芯片近10倍。
目前,这篇题为《基于国产CPU/GPU平台的水动力模型异构并行计算》的研究报告已经公开在学术平台知网。
观察者网从中国水利行业学术期刊《水利学报》了解到,相关文章即将刊登于该期刊。
“中国科学家面临的挑战更加艰巨。”《南华早报》称,在硬件方面,像A100和H100这样的先进GPU的生产由外国制造商主导。
在软件方面,总部位于美国的英伟达限制其CUDA软件生态系统在第三方硬件上运行,从而阻碍了独立算法的发展。
文章作者、河海大学长江保护与绿色发展研究院教授南统超指出,基于以上原因,
有必要基于国产CPU/GPU产业现状发展“多节点-多GPU”异构并行计算方案。
据介绍,并行计算成功的关键,在于高效的数据传输和多个节点之间的任务协调,从而最大限度地减少性能损失。
2021年,橡树岭国家实验室的研究人员使用Summit超级计算机推出了一种名为TRITON的“多节点-多GPU”洪水预报模型。
尽管部署了64个节点,但TRITON的处理速度仅提高了约6倍。
相比之下,南统超团队提出一种创新架构,将多个GPU合并到单个节点中,以抵消国内硬件的性能限制。
通过在软件级别改进节点之间的数据交换,他的模型大大减少了通信开销。
文章提到,该模型建立在国产通用的x86计算平台上,CPU为国产海光7185处理器,32核64线程,主频2.5GHz,
GPU也是国产的,支持128GB内存,网络带宽200Gb/s。新模型仅使用7个节点就实现了6倍的加速,比TRITON使用的数量少了约89%。