【显卡世界大变天】NAI 三家占比 82:9:9

统计/生物统计/精算/数据科学/机器学习(含深度学习和强化学习)
本版讨论各种专业问题,相关职业问题,转专业问题,以及机器学习在各个学科的应用。

版主: SOD

回复
头像
SOD楼主
论坛元老
论坛元老
SOD 的博客
帖子: 17032
注册时间: 7月 23, 2022, 10:53 pm

【显卡世界大变天】NAI 三家占比 82:9:9

帖子 SOD楼主 »

Intel进入游戏卡市场仅一年AMD就从老二掉到老三
原创 硬件世界2023-03-02 23:2842

在游戏显卡市场上,长期以来都是AMD及NVIDIA两家的二人转,2022年Intel正式杀入了显卡市场,虽然只上市了A380、A750、A770等几款显卡,然而这就让显卡市场换天了,抢占了AMD的第二。

根据JPR公布的2022年Q4季度全球独显GPU报告,GPU独显出货量只有1300万块,同比减少50%,销售额下滑了24%(这里可以看出显卡涨价了),其中的原因不难理解,21年底还有矿卡大热,2022年底矿卡早就崩了。

更有意思的是显卡份额变化,NVIDIA变得更强了,市场份额从之前的78%增长到了82%,AMD则从之前的18%下滑到了9%,Intel从0%直接涨到了9%的份额。
图片


虽然AMD及Intel两家的份额都是9%,但具体出货量还是有些差别的,有些外媒报道中称AMD的出货量实际上已经略低于Intel,正式从显卡市场老二变成了老三。

这个只是Q4季度的情况,Intel大涨有很大一个原因是去年底A750/A770显卡降价,而AMD去年底只有RX 7900 XT/XTX等高端显卡上市,销量显然不能比。

EE芯视频推荐
视频:Prophesee: 99%的视觉数据在AI处理中是无用的
更主要的是市场空间相比上一年直接缩水一半,只有1300万块的销量,Intel随便努力一下就有不错的效果。

无论如何,AMD的显卡是要加把劲了。



至于N卡,在游戏市场上没有对手,自己也有了更高的追求。

ChatGPT最近火得一塌糊涂,也将AI人工智能推向了新的高潮,而生成式AI需要海量的数据进行推理训练,高算力的GPU加速卡自然成了抢手货。

比如ChatGPT背后的GPT模型,其训练参数在2018年约为1.2亿个,到了2020年就猛增到近1800亿个,如今恐怕至少在万亿级别。

集邦咨询估计,生成式AI对于GPU计算卡的需求量在2万块左右,未来将达到3万块。

这其中受益最多的,自然是NVIDIA,其旗舰级计算卡A100已经在为ChatGPT默默服务,有估算需要3万块才能满足ChatGPT当前的访问量。

A100计算卡单块售价8-9万元左右,3万块就是大约25个亿。



但它往往不是单卖的,而是以DGX A100服务器整套方案的方式销售,每套八块计算卡,算力高达5PFlops(每秒5千万亿次浮点计算),相当于前几年的一套大型超级计算机,是大规模数据分析、AI加速计算的几乎不二之选。

DGX A100服务器单套售价约20万美元,3万块卡下来就是大约7.5亿美元,相当于人民币超过50亿元。

当然,AMD也有MI100、MI200系列加速卡,今年还会推出CPU+GPU融合的全新MI300,算力也很强,但市场份额远不如NVIDIA。

另外,有数据显示,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型,训练成本介于200万美元至1200万美元之间。
此生无悔入华夏,家住加利福利亚

图片
头像
SOD楼主
论坛元老
论坛元老
SOD 的博客
帖子: 17032
注册时间: 7月 23, 2022, 10:53 pm

Re: 【显卡世界大变天】NAI 三家占比 82:9:9

帖子 SOD楼主 »

超出预期的游戏显卡,从性能到兼容性,Intel Arc A750新驱动上手
https://www.bilibili.com/read/cv2196617 ... icleDetail
专栏/超出预期的游戏显卡,从性能到兼容性,Intel Arc A750新驱动上手体验
超出预期的游戏显卡,从性能到兼容性,Intel Arc A750新驱动上手体验
2023-02-21 07:39164阅读 · 1喜欢 · 0评论

中山狐
粉丝:9文章:183
关注
前言:

对于游戏玩家而言,游戏显卡最重要的是流畅、画质好、稳定、发热低、实惠这些要求。归结就两个字-好用。毕竟旗舰级显卡、顶级主机属于少数人的消费而已,工薪消费都是理性当先。

2022年10月5号英特尔解禁了锐炫A770、锐炫A750两款台式机显卡的性能表现。然而消费者总是会对新品有所疑问的,尤其是性能与游戏兼容性方面。下面再次对第二款Intel游戏显卡进行测试与分析。



Xe HPG 微架构赏析:

毕竟是新事物,我们先从结构上来谈谈。

Arc A770 与A750 使用相同ACM-G10 GPU,代号Alchemist、Xe HPG 微架构的最强游戏GPU,包办着DirectX 12 Ultimate、光线追踪、AI、XeSS、AV1 编码、HDMI 2.1 等新一代绘图技术。Arc A770 与A750 分别对应2K / 1440p 与FHD 1080p 游戏玩家。


Xe-HPG架构中最多可以拓展8个Render Slice,根据GPU的规格不同可以自由组合Render Slice,其中每个Slice中包含四组Xe-core构成,其中Xe-core主要由16个256位的XVE(矢量引擎),加上16个1024位的XMX(矩阵引擎)组成,其中XVE矢量引擎主要负责传统的图形运算,而XMX矩阵引擎则可以实现XeSS超采样技术,同时还有专门用户实现光线追踪的计算单元。


其中Intel Arc A770采用了完整的ACM-G10核心,拥有32组Xe核心(等效4096个流处理器)和32个光线追踪单元,其中A770包含两个显存版本的型号,其中一个为16GB GDDR6内存,另外一个则是8G显存的版本,除此之外,两款A770显卡规格一样,而A750相对于A770砍掉了4组Xe核心,光追单元也砍掉了4组,频率降低50MHz,显存为8GB。


新一代的GPU均为图形核心、光线追踪核心以及AI人工智能三部分组成。Xe HPG同样如此,除了包办GPU 所需的Vector Engines,更具备AI 所需的XMX matrix engine 设计,同时具备独立的Ray-Tracing 单元,进一步整合Rasterization、Ray Tracing 的混合渲染功能。

简单来说,一组Xe核心等效于128个流处理器,包含一个原生的物理光线追踪单元,甚至我们大胆假设,以后Intel很可能会将更多的Xe核心封装到新的GPU上,从而通过更大的核心实现更强大的性能。


而Intel独有的XeSS 超解析度技术,同样也是一个AI深度学习与神经网络的应用。基于XMX指令单元:首先降低分辨率,进行渲染、前期处理,然后由XeSS介入,替代传统的TAA抗锯齿,再缩放提升分辨率,输出画面。

它不但支持Intel Arc系列显卡,也可用于任何支持Sahder Model 6.4的显卡,也就是说并不限于Intel自家和新显卡。



开箱赏析篇:


我手上的这一款ARC A750同样也是一块公版卡,包装和外观都是简约而具备Intel的经典VI,A750采用双风扇的设计,风扇采用了静音设计,即便在满载的时候,噪音也不会超过39分贝,正常电脑桌与座椅距离内基本听不到任何声音,配合上封闭式的机箱,哪怕深夜也不会影响睡眠。


显卡外观采用流线、圆润的黑化造型,表面材质触感像是肤质表面,搭配2 颗8.5cm、15 扇叶的风扇进行主动散热。


显卡长约26.5cm、占用2 个PCIe 插槽(含背板4cm 厚度)。显卡的侧面有着Intel Arc 的发光(白光)标志以及PCIe 8+6 pin 供电,满足显卡TBP 225W 的供电需求。


A750侧面有镀铬装饰条,金属质感十足。供电方面采用了8+6pin接口,功耗为225W,对于主流级别的用户来讲,500W的电源基本能够轻松胜任,没有什么太大的问题。也就是说,Intel的两款新显卡对于旧用户升级是非常友好的,只要电源额定功耗大于500W,并且平台为十代酷睿以后的尽可以直接换上新显卡进行升级。


唯一要注意的一点是Arc A770与A750显卡需要Resizable BAR或SAM功能的支持,英特尔强烈建议用户先检查、确定自己的电脑支持这项功能之后,再考虑选购其Arc系列显卡。

可能有很多朋友不了解“Resizable BAR”技术,下面简要介绍一下,在传统的基于Windows的计算机系统中,受限于PCIe的限制,处理器一次只能读取256MB显存。而随着显存容量和PCIe通道通信能力的提升,这一规范已经成为了制约性能的瓶颈。


显卡的背面则是横纹装饰设计,同时金属的背板的加持,更进一步提升显卡的颜值和质感,并且能够更好地保护PCB不会变形。而且A750的背面还有金色老虎纹,霸气十足。


装入机箱后,大家就更加能够体验到公版显卡的好处,只有两卡槽的厚度,而且重量不大,不会有下垂甚至拉裂PCB的隐患。


背板的虎头,妥妥地颜值担当。不仅仅美观,从实际使用中,背板的导热效果不俗,有利于提高系统的稳定性。

视频接口方面依旧是标准的 3 个 DP 2.0+1 个 HDMI 2.1,是目前最高端的搭配了,可以支持最高 8K 视频输出。


双风扇散热其实是一种合理性挺高的方案,既不会有太大的噪音,也不会增加太多的厚度和重量。比起散热,内部用料和做工才是更加重要的。

A750采用铜底均温板与GPU、VRAM 接触,并通过热导管将热引导致散热鳍片,在借由双风扇进行主动散热。显卡一样有着压铸铝合金中框,借由中框与PCIe 档板、电路板相互固定,提升电路板的强度随后再锁上散热器。

采用6 相VRM 供电,而GPU 周围则有8 颗GDDR6 内存。可以说,内部做工还是非常严谨的。



性能与体验:


测试之前,我们先来看看显卡的额GPU-z信息。可以看到,A750基于ACM-G10核心,具有28个Xe核心,相当于是448个流媒体,28个光线追踪单元(光追单元是软件无法检测的),112个纹理单元,224个光栅单元。8GB256bit位宽的GRR6显存,支持OpenGL、光线追踪、Vulkan等游戏API,并支持OpenCL、DirectML、DirectCompute三大通用计算。

我的测试平台是13代酷睿,可以看到所需的Resizable BAR也已经打开(BIOS默认打开)。


驱动版本方面,Intel先后推出了五版的驱动,为了方面大家感受其改进,我特意选取了最新版的4091以及发售后第二版的3082进行比较。当然了,除了官网下载更新外,Intel的显卡以及全系列版本都可以通过“英特尔驱动程序和支持助理”进行管理与更新,无需借助第三方工具,更快捷更纯净。





测试平台方面,采用了十三代酷睿i5 13400F处理器,搭载B760芯片组,DDR5 6000内存以及额定850W电源,并且显卡安装于第一根PCI-E 4.0 16x槽上面,并运行于PCI-E 4.0 16x模式。综上,足够满足Intel A750的性能全面发挥。



具体配置如下:

CPU:Intel i5 13400



主板:技嘉B760M小雕



内存:威刚XPG DDR5 6000 8GBX2

显卡:Intel ARC A750



硬盘:WD black SN750 1TB



散热器:威刚 240水冷



电源:威刚 额定850W 80plus金牌认证全模组



机箱:威刚 XPG幻镜双侧透



1、3DMARK 理论测试



光线追踪测试



先来看看光线追踪测试场景Port Royal,旧版驱动是6532分,新版驱动是6558分,区别并不是很大,也就是说Intel驱动在光线追踪部分完善度不错。



另外一个光线追踪功能测试,旧版驱动是28.99帧,新版驱动是29.40,新版有小幅度提高,但可以说Intel显卡驱动的光线追踪一开始已经做的不错了。



Xess超解释度技术



作为Intel GPU的AI应用,3DMARK也是第一时间提供了支持和测试,通过测试我们可以看到,新老驱动在开启后均提升50%左右,关闭Xess为27帧,开启为41帧,同样是新驱动保持持续提升的趋势。



DX12测试



3DMARK的DX12测试有两个场景,Speed Way为新场景,测试速度更快负载更加高。旧驱动为2316分,新驱动为2345分,依然保持上升趋势。



另外一个DX12测试场景Time spy里面,新旧驱动几乎是一致的。



DX11测试场景Fire Strike场景EX模式也是类似,新旧驱动分数并没有明显的差别。



2、地铁:离去



经典光线追踪游戏地铁:离去,全开光线追踪特效后,1080P和2k分辨率下面A750分别取得了53帧和43帧,新老驱动差距不足0.3帧。



3、古墓丽影11:暗影


古墓丽影11:暗影是第一批支持Intel Xess技术的游戏,开启Xess后,游戏性能有明显的提高。



Xess和光线追踪同样是有多档可调的,开启Xess和光线追踪最高档后,1080P和2k分辨率下面A750分别取得了72帧和50帧,新老驱动差距不足1帧。但是关闭Xess后,1080P和2k分辨率分别下降4帧和3帧。


现有支持Xess技术的游戏大约是30款左右,受限于手上游戏有限,以后再给大家补上。



德军总部:新血脉



1080P和2k分辨率下面A750分别取得了194帧和125帧,新老驱动差距不足3帧。



小结:


不得不说,现在支持Xess技术的游戏并不算太多,所以多数的光线追踪游戏纯粹靠A750内部的28个光线追踪单元硬肝,然而在1080P和2K分辨率下面,都有不错的表现。相信3A大作通过后续更新支持Xess技术以后,性能会有进一步的提高。


值得一说的一点是,即使是发布第二版的3802版驱动,对于光线追踪和DX12方面的性能也已经展现非常好,新驱动有小幅度提高。一定程度来说,正面Intel的驱动方面完善程度比较高,并不会出现大家担心的新显卡各种经常抢救性升级的,debug一类的烦恼。

但是,不少老玩家提出一个疑问,新显卡会不会厚此薄彼,只优化新游戏,对于DX9级别的经典游戏视而不见呢?这一点分开两个方面看,一方面来说,DX9之前的老游戏部分已经不能被win11系统完美兼容,更别说能全部用上新显卡新架构;另外一方面,太老的游戏,尤其是DX7之前那种,建议大家放不下的话还是搞个虚拟机算了,压根就用不上啥显卡的,我好几个发小就是用虚拟机肝老版本的足球经理、星际争霸1之类的游戏。


那么对于坚守DX9经典游戏的有情怀玩家以及CSGO、LOL两大世界顶级电竞游戏来说,后面的测试才是你们关注的重点,通过两个版本驱动的比较,我们可以了解一下,Intel独显对于经典游戏的支持程度。



5、3DMARK06



3Dmark 06作为DX9基准测试的巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。

当然了,现在我们的CPU基本上都是六核心以上,而且IPC性能也远非2006年的CPU可比,因此,CPU性能测试的部分建议忽略,我们单纯看图形性能即可。

有点意外的是,居然3802旧版驱动的得分是43458,而4903新版就破5万,可以看到,新版居然真的对于DX9特意有优化。



2、生化危机5



如果说基准测试不够直观的话,我们换一个经典游戏-生化危机5来看看。旧驱动综合成绩是242.1帧,而新驱动居然达到了344.6帧,差距居然达到100帧。看到这种结果,我还特意重新分别测试了3次,差距也就是3-5帧左右,整体维持原结果不变,看来Intel新驱动倒是认真对待老玩家了。



6、CSGO



下面是重头戏,FPS电竞大咖的最爱-CSGO。CSGO并没与自带benchmark,但我们可以通过回放进行赛事复盘,我选择的赛事就是2008年科隆大赛的第一场,通过微星小飞机软件进行监测。

左上角一排的数据第一个红色的是实时帧数,后面三个白色的分别是最小、平均、最高,其中平均值最具备参考价值。图片建议大家点击放大,看清楚。

旧驱动的平均帧数不到200,仅有197帧左右,但是新驱动可以轻轻松松破300帧,达到337帧左右。这样的差距比起生化危机5更加大。



7、LOL英雄联盟



LOL我采用的是实际进行游戏进行数据分析,同样也是通过小飞机进行监测。

对于游戏最重要的平均帧,旧驱动是138帧,新驱动是192帧,而且团战的时候也不会出现掉帧的问题(受限于技术只打匹配路人局,并没有遭遇到5v5的大作战,一般是3v3比较多)。



DX9小结:

测试前,我不过是打算了解一下兼容性而已,没想到实际的结果有点出人意料。Intel居然专门对于经典游戏和热门电竞进行了优化,CSGO还有一张Intel的新地图,看来Intel是打算迅速和电竞玩家打成一片。



总结:

其实特意把DX9部分独立出来的主要原因,就是针对于之前不少玩家对于新显卡只顾眼前人不顾旧人的担心。毕竟,厂家的精力是有限的,而且对游戏的兼容和优化会一定程度造就了驱动容量爆炸。Intel的驱动居然是1.2GB,其实就是包含了游戏优化的部分。

其实,对于本本用户来说,Intel驱动的用心倒是更加了解。过往核显的时代,每一次驱动更新,Intel都有详尽的说明是改进和优化了某一些游戏。也就是说,Intel做显卡和搞驱动并不是短期的。




单说intel锐炬,其实早在2012年就已经发布,甚至尝试过把大容量显存集成到CPU中。从五代酷睿5775C的性能表现来说是不错的,就是成本不占优。

而2020年锐炬升级为Xe结构后,就可以知道后面的事情必然是水到渠成的。ACM-G10 GPU可以说是Intel在GPU通用计算领域上面的初步收成,期望后续Xe结构继续发展,推出更强大的GPU,满足玩家更高的要求。
此生无悔入华夏,家住加利福利亚

图片
回复

回到 “统计与数据科学(Statistics & DataScience)”