壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

对应老买买提的军事天地,观点交锋比较激烈。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。

版主: Softfist

头像
foofy(自带干粮五毛)楼主
论坛元老
论坛元老
帖子互动: 440
帖子: 15589
注册时间: 2022年 8月 10日 01:38

壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 foofy(自带干粮五毛)楼主 »

https://news.mydrivers.com/1/851/851378.htm

壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

2022-08-10 00:30:32 出处:雷峰网 作者:包永刚 编辑:上方文Q 人气: 8704 次 评论(31)点击可以复制本篇文章的标题和链接
#壁仞科技#GPU
202631
GPU明星初创公司壁仞科技,选在公司创立即将三年之际正式发布首款通用GPU芯片BR100。

BR100采用7nm工艺,集成770亿晶体管,使用Chiplet(芯粒)技术,2.5D CoWos封装技术,芯片面积达到1000平方毫米。

BR100通用GPU 16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,FP32算力超越英伟达在售旗舰GPU一个数量级。

图片
壁仞科技创始人、董事长、CEO张文

壁仞科技2019年9月9日注册成立,在成立后的短短18个月,融资额超过47亿元,创下了国内芯片创业公司融资的记录,也成为了业界关注的焦点。

今天的发布会上,壁仞科技创始人、董事长、CEO张文也谈到,大算力芯片创业至少要15亿元起。而且,芯片行业本来就是资金密集、人才密集和资源密集的行业。

壁仞科技经过了1065天研发,正式发布的首款GPU,打破了全球通用GPU算力记录,这是该记录第一次由中国企业创造,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。

图片

喊出响亮的口号显然不能回应业界的一些质疑,只有真正强大的产品可以。

图片

壁仞科技给出的数据显示,其首款旗舰产品BR100对比英伟达在售的旗舰GPU峰值算力在Int8、BF16、TF32/TF32+、FP32数据格式下最少有3.3倍的峰值性能优势,在FP32数据格式下性能优势更是达到了13.1倍。

图片

图片

图片

图片

如果与国际厂商最新旗舰峰值算力对比,各种数据格式下也有性能优势。

对于一家初创公司来说,想要超越英伟达最新的H100 GPU,挑战十分巨大,抛开其它因素,仅看一些关键参数,就能看到两者之间的差距,以及想要超越的难度。

英伟达今年发布的最新GPU H100,采用的是专为英伟达加速计算需求设计优化的TSMC 4N 工艺,集成800亿个晶体管,显著提升了AI、HPC、显存带宽、互连和通信的速度,并能够实现近5TB/s的外部互联带宽。

英伟达CEO黄仁勋发布H100时表示,20个H100 GPU便可承托相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。

当然,壁仞科技联合创始人、CTO洪洲也给出了壁仞科技首款通用GPU能实现突破性性能的底层原因——自主原创的芯片架构壁立仞。

壁立仞架势是以数据流为中心的架构,目标就是打破当前GPU架构面临的瓶颈,实现更强大的性能。具体而言,壁立仞架构有6大特性:TF32+数据流精度、TDA数据流存取加速、C-Warp数据流并行、NME减少数据搬移、NUMA/UMA减少数据搬移、SVI数据流隔离。

图片

洪洲说:“壁立仞架构对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。”

除了架构方面的努力,壁仞科技业采用了Chiplet的设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑。“通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。” 洪洲同时表示。

图片

除了旗舰级BR100,壁仞科技今天还发布了BR104,同样采用壁立仞架构,拥有1个计算芯粒,性能约为BR100的一半,同样超越了国际厂商的在售旗舰产品。

图片
壁仞科技联合创始人、CTO洪洲

图片

图片

基于BR100和BR104的产品分别叫做壁砺100和壁砺104,可以构建从板卡模组到服务器的产品。

图片

当然,壁仞科技也深知大算力芯片比拼的是软件和生态,更需要客户的支持。

基于BR100,壁仞科技自主研发BIRENSUPA软件平台,这一平台位于软件栈的中心位置,包括BIRENSUPA编程模型、加速库、工具链、编译器等组件。开发者可以通过这些组件,发挥BR100系列硬件的算力,并开发各种应用。

图片

发布会上,壁仞科技联席CEO李新荣与百度飞桨训练芯片适配技术负责人李琦共同宣布,壁仞科技加入由百度飞桨发起的硬件生态共创计划。

图片

对于一家初创公司而言,建设生态的周期非常长,投入也十分巨大,所以壁仞科技也会兼容目前主流的GPU生态,与客户现有的基础设施做到高度的兼容,方便客户的迁移。

同时,壁仞也建设自己的生态,比如,壁仞科技开发者云也已经正式上线,官网上已开放邀测。

平安科技以及中国移动都在发布会上明确了与壁仞科技的合作目标。

从硬件到软件再到应用,壁仞科技已经正式交出了首款产品的答卷,接下来就要接受市场的检验了。
StokesTheorem
版内封禁中版内封禁中
帖子互动: 43
帖子: 6141
注册时间: 2022年 7月 27日 10:51

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 StokesTheorem »

过几年,这种新闻更多
你们这些法轮功和民运都是低级黑高级红,为反而反,从来不知道实事求是。NMB不干正事,整天喊什么“中共邪教、天灭中共”这种智障傻逼话,只会让正常人更反感反共这群人,这就是为什么现在都把这群傻逼称为轮子和民逗,真是成事不足败事有余,我都怀疑是不是已经被共产党收买了故意这么搞的。还有民逗整天制造低水平智障谣言,企图用一个谎言去击败另一个谎言,但是当谎言被戳穿就再也没有人相信你了。前几年墙内大面积转向粉红的重要原因之一就是各种民逗和sb公知炮制的谎言被戳穿了。
头像
verdelite(众傻之傻)
论坛元老
论坛元老
帖子互动: 926
帖子: 22867
注册时间: 2022年 7月 21日 23:33

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 verdelite(众傻之傻) »

还是需要台积电代工。
没有光子;也没有量子能级,量子跃迁,量子叠加,量子塌缩和量子纠缠。
基佬同志(肛需)
见习点评
见习点评
帖子互动: 19
帖子: 1926
注册时间: 2022年 8月 8日 13:05

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 基佬同志(肛需) »

骗钱的项目无疑。
头像
hhcare(钟馗)
论坛元老
论坛元老
2024年度十大优秀网友
帖子互动: 1947
帖子: 59279
注册时间: 2022年 7月 29日 10:28

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 hhcare(钟馗) »

个人认为是骗钱的。。。
dreamig
论坛支柱
论坛支柱
帖子互动: 256
帖子: 12007
注册时间: 2022年 7月 26日 22:43

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 dreamig »

基本上就是骗钱的
头像
foofy(自带干粮五毛)楼主
论坛元老
论坛元老
帖子互动: 440
帖子: 15589
注册时间: 2022年 8月 10日 01:38

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 foofy(自带干粮五毛)楼主 »

dreamig 写了: 2022年 8月 11日 00:44 基本上就是骗钱的
浪潮信息来发表会了。
dreamig
论坛支柱
论坛支柱
帖子互动: 256
帖子: 12007
注册时间: 2022年 7月 26日 22:43

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 dreamig »

foofy 写了: 2022年 8月 10日 23:53 https://news.mydrivers.com/1/851/851378.htm

壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

2022-08-10 00:30:32 出处:雷峰网 作者:包永刚 编辑:上方文Q 人气: 8704 次 评论(31)点击可以复制本篇文章的标题和链接
#壁仞科技#GPU
202631
GPU明星初创公司壁仞科技,选在公司创立即将三年之际正式发布首款通用GPU芯片BR100。

BR100采用7nm工艺,集成770亿晶体管,使用Chiplet(芯粒)技术,2.5D CoWos封装技术,芯片面积达到1000平方毫米。

BR100通用GPU 16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,FP32算力超越英伟达在售旗舰GPU一个数量级。

图片
壁仞科技创始人、董事长、CEO张文

壁仞科技2019年9月9日注册成立,在成立后的短短18个月,融资额超过47亿元,创下了国内芯片创业公司融资的记录,也成为了业界关注的焦点。

今天的发布会上,壁仞科技创始人、董事长、CEO张文也谈到,大算力芯片创业至少要15亿元起。而且,芯片行业本来就是资金密集、人才密集和资源密集的行业。

壁仞科技经过了1065天研发,正式发布的首款GPU,打破了全球通用GPU算力记录,这是该记录第一次由中国企业创造,中国的通用GPU芯片正式迈入“每秒千万亿次计算”新时代。

图片

喊出响亮的口号显然不能回应业界的一些质疑,只有真正强大的产品可以。

图片

壁仞科技给出的数据显示,其首款旗舰产品BR100对比英伟达在售的旗舰GPU峰值算力在Int8、BF16、TF32/TF32+、FP32数据格式下最少有3.3倍的峰值性能优势,在FP32数据格式下性能优势更是达到了13.1倍。

图片

图片

图片

图片

如果与国际厂商最新旗舰峰值算力对比,各种数据格式下也有性能优势。

对于一家初创公司来说,想要超越英伟达最新的H100 GPU,挑战十分巨大,抛开其它因素,仅看一些关键参数,就能看到两者之间的差距,以及想要超越的难度。

英伟达今年发布的最新GPU H100,采用的是专为英伟达加速计算需求设计优化的TSMC 4N 工艺,集成800亿个晶体管,显著提升了AI、HPC、显存带宽、互连和通信的速度,并能够实现近5TB/s的外部互联带宽。

英伟达CEO黄仁勋发布H100时表示,20个H100 GPU便可承托相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。

当然,壁仞科技联合创始人、CTO洪洲也给出了壁仞科技首款通用GPU能实现突破性性能的底层原因——自主原创的芯片架构壁立仞。

壁立仞架势是以数据流为中心的架构,目标就是打破当前GPU架构面临的瓶颈,实现更强大的性能。具体而言,壁立仞架构有6大特性:TF32+数据流精度、TDA数据流存取加速、C-Warp数据流并行、NME减少数据搬移、NUMA/UMA减少数据搬移、SVI数据流隔离。

图片

洪洲说:“壁立仞架构对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。”

除了架构方面的努力,壁仞科技业采用了Chiplet的设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑。“通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。” 洪洲同时表示。

图片

除了旗舰级BR100,壁仞科技今天还发布了BR104,同样采用壁立仞架构,拥有1个计算芯粒,性能约为BR100的一半,同样超越了国际厂商的在售旗舰产品。

图片
壁仞科技联合创始人、CTO洪洲

图片

图片

基于BR100和BR104的产品分别叫做壁砺100和壁砺104,可以构建从板卡模组到服务器的产品。

图片

当然,壁仞科技也深知大算力芯片比拼的是软件和生态,更需要客户的支持。

基于BR100,壁仞科技自主研发BIRENSUPA软件平台,这一平台位于软件栈的中心位置,包括BIRENSUPA编程模型、加速库、工具链、编译器等组件。开发者可以通过这些组件,发挥BR100系列硬件的算力,并开发各种应用。

图片

发布会上,壁仞科技联席CEO李新荣与百度飞桨训练芯片适配技术负责人李琦共同宣布,壁仞科技加入由百度飞桨发起的硬件生态共创计划。

图片

对于一家初创公司而言,建设生态的周期非常长,投入也十分巨大,所以壁仞科技也会兼容目前主流的GPU生态,与客户现有的基础设施做到高度的兼容,方便客户的迁移。

同时,壁仞也建设自己的生态,比如,壁仞科技开发者云也已经正式上线,官网上已开放邀测。

平安科技以及中国移动都在发布会上明确了与壁仞科技的合作目标。

从硬件到软件再到应用,壁仞科技已经正式交出了首款产品的答卷,接下来就要接受市场的检验了。
过几年这几个人进局子的几率有多大?
yokel(uuuu)
论坛元老
论坛元老
帖子互动: 568
帖子: 14547
注册时间: 2022年 7月 28日 11:14

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 yokel(uuuu) »

14nm及以下EDA刚被禁了
拿啥去流片?
头像
foofy(自带干粮五毛)楼主
论坛元老
论坛元老
帖子互动: 440
帖子: 15589
注册时间: 2022年 8月 10日 01:38

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 foofy(自带干粮五毛)楼主 »

yokel 写了: 2022年 8月 11日 01:13 14nm及以下EDA刚被禁了
拿啥去流片?
台积电
dingding
正式会员
正式会员
帖子互动: 0
帖子: 11
注册时间: 2022年 7月 27日 00:29

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 dingding »

这个很不错啊,跑通了几个重要的 benchmark,至少在这几个典型任务上是非常好的性能,自研的 ip。也许通用形上还有不少差距,但这作为第一步,算是中国芯片设计领域的一个重大突破
--
一花一世界
dingding
正式会员
正式会员
帖子互动: 0
帖子: 11
注册时间: 2022年 7月 27日 00:29

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 dingding »

Nvidia gpu 里很多功能是 ai 计算不需要的,在ai计算通用性也更好些

jim Keller 的 tenstorrent 架构/软件的创新更多一些
--
一花一世界
头像
laojin(金晟——已经死了)
修改邮箱后未激活修改邮箱后未激活
帖子互动: 8
帖子: 1154
注册时间: 2022年 7月 24日 01:47

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 laojin(金晟——已经死了) »

女大的优势在于驱动程序和通用计算的CUDA库。极其庞大,美国超算都要用。

土鳖这方面不是一朝一夕能赶上的。
☭主体思想の光辉万万年!
头像
swjtuer
论坛元老
论坛元老
帖子互动: 1133
帖子: 35172
注册时间: 2022年 7月 21日 22:32

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 swjtuer »

只有芯骗产业
hhcare 写了: 2022年 8月 11日 00:36 个人认为是骗钱的。。。
goFan
论坛支柱
论坛支柱
帖子互动: 406
帖子: 12186
注册时间: 2022年 7月 21日 20:15

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 goFan »

等芯片造出来了,仍然有一多半人会买高通芯,intek 芯,苹果芯

中国造出好车了,还有一多半人买外国牌子
goFan
论坛支柱
论坛支柱
帖子互动: 406
帖子: 12186
注册时间: 2022年 7月 21日 20:15

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 goFan »

这个如果造出成品,打游戏挖矿性价比高出钕大,那还是能卖出去的
w1h
见习写手
见习写手
帖子互动: 0
帖子: 93
注册时间: 2022年 8月 2日 20:34

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 w1h »

FF第二?
goFan
论坛支柱
论坛支柱
帖子互动: 406
帖子: 12186
注册时间: 2022年 7月 21日 20:15

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 goFan »

FF 如果专心在国内造,早出厂了。
弄到米国来圈钱,却忽略了米国的蜗牛速度
上次由 goFan 在 2022年 8月 11日 03:19 修改。
头像
foofy(自带干粮五毛)楼主
论坛元老
论坛元老
帖子互动: 440
帖子: 15589
注册时间: 2022年 8月 10日 01:38

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 foofy(自带干粮五毛)楼主 »

假药停起个大早,赶个晚集
goFan
论坛支柱
论坛支柱
帖子互动: 406
帖子: 12186
注册时间: 2022年 7月 21日 20:15

Re: 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

帖子 goFan »

许家印都搞出电车了,还有那个高合,不知是哪个三脚猫也搞出来了
回复

回到 “军事天地(Military)”