【显卡世界大变天】NAI 三家占比 82:9:9

SOD · 帖子由 **SOD楼主** » 3月 2, 2023, 11:36 am

Intel进入游戏卡市场仅一年AMD就从老二掉到老三
原创硬件世界2023-03-02 23:2842

在游戏显卡市场上，长期以来都是AMD及NVIDIA两家的二人转，2022年Intel正式杀入了显卡市场，虽然只上市了A380、A750、A770等几款显卡，然而这就让显卡市场换天了，抢占了AMD的第二。

根据JPR公布的2022年Q4季度全球独显GPU报告，GPU独显出货量只有1300万块，同比减少50%，销售额下滑了24%（这里可以看出显卡涨价了），其中的原因不难理解，21年底还有矿卡大热，2022年底矿卡早就崩了。

更有意思的是显卡份额变化，NVIDIA变得更强了，市场份额从之前的78%增长到了82%，AMD则从之前的18%下滑到了9%，Intel从0%直接涨到了9%的份额。

虽然AMD及Intel两家的份额都是9%，但具体出货量还是有些差别的，有些外媒报道中称AMD的出货量实际上已经略低于Intel，正式从显卡市场老二变成了老三。

这个只是Q4季度的情况，Intel大涨有很大一个原因是去年底A750/A770显卡降价，而AMD去年底只有RX 7900 XT/XTX等高端显卡上市，销量显然不能比。

EE芯视频推荐
视频：Prophesee: 99%的视觉数据在AI处理中是无用的
更主要的是市场空间相比上一年直接缩水一半，只有1300万块的销量，Intel随便努力一下就有不错的效果。

无论如何，AMD的显卡是要加把劲了。

至于N卡，在游戏市场上没有对手，自己也有了更高的追求。

ChatGPT最近火得一塌糊涂，也将AI人工智能推向了新的高潮，而生成式AI需要海量的数据进行推理训练，高算力的GPU加速卡自然成了抢手货。

比如ChatGPT背后的GPT模型，其训练参数在2018年约为1.2亿个，到了2020年就猛增到近1800亿个，如今恐怕至少在万亿级别。

集邦咨询估计，生成式AI对于GPU计算卡的需求量在2万块左右，未来将达到3万块。

这其中受益最多的，自然是NVIDIA，其旗舰级计算卡A100已经在为ChatGPT默默服务，有估算需要3万块才能满足ChatGPT当前的访问量。

A100计算卡单块售价8-9万元左右，3万块就是大约25个亿。

但它往往不是单卖的，而是以DGX A100服务器整套方案的方式销售，每套八块计算卡，算力高达5PFlops(每秒5千万亿次浮点计算)，相当于前几年的一套大型超级计算机，是大规模数据分析、AI加速计算的几乎不二之选。

DGX A100服务器单套售价约20万美元，3万块卡下来就是大约7.5亿美元，相当于人民币超过50亿元。

当然，AMD也有MI100、MI200系列加速卡，今年还会推出CPU+GPU融合的全新MI300，算力也很强，但市场份额远不如NVIDIA。

另外，有数据显示，GPT-3训练一次的成本约为140万美元，对于一些更大的LLM模型，训练成本介于200万美元至1200万美元之间。

SOD · 帖子由 **SOD楼主** » 3月 2, 2023, 11:45 am

超出预期的游戏显卡，从性能到兼容性，Intel Arc A750新驱动上手
https://www.bilibili.com/read/cv2196617 ... icleDetail
专栏/超出预期的游戏显卡，从性能到兼容性，Intel Arc A750新驱动上手体验
超出预期的游戏显卡，从性能到兼容性，Intel Arc A750新驱动上手体验
2023-02-21 07:39164阅读 · 1喜欢 · 0评论

中山狐
粉丝：9文章：183
关注
前言：

对于游戏玩家而言，游戏显卡最重要的是流畅、画质好、稳定、发热低、实惠这些要求。归结就两个字-好用。毕竟旗舰级显卡、顶级主机属于少数人的消费而已，工薪消费都是理性当先。

2022年10月5号英特尔解禁了锐炫A770、锐炫A750两款台式机显卡的性能表现。然而消费者总是会对新品有所疑问的，尤其是性能与游戏兼容性方面。下面再次对第二款Intel游戏显卡进行测试与分析。

Xe HPG 微架构赏析：

毕竟是新事物，我们先从结构上来谈谈。

Arc A770 与A750 使用相同ACM-G10 GPU，代号Alchemist、Xe HPG 微架构的最强游戏GPU，包办着DirectX 12 Ultimate、光线追踪、AI、XeSS、AV1 编码、HDMI 2.1 等新一代绘图技术。Arc A770 与A750 分别对应2K / 1440p 与FHD 1080p 游戏玩家。

Xe-HPG架构中最多可以拓展8个Render Slice，根据GPU的规格不同可以自由组合Render Slice，其中每个Slice中包含四组Xe-core构成，其中Xe-core主要由16个256位的XVE（矢量引擎），加上16个1024位的XMX（矩阵引擎）组成，其中XVE矢量引擎主要负责传统的图形运算，而XMX矩阵引擎则可以实现XeSS超采样技术，同时还有专门用户实现光线追踪的计算单元。

其中Intel Arc A770采用了完整的ACM-G10核心，拥有32组Xe核心(等效4096个流处理器）和32个光线追踪单元，其中A770包含两个显存版本的型号，其中一个为16GB GDDR6内存，另外一个则是8G显存的版本，除此之外，两款A770显卡规格一样，而A750相对于A770砍掉了4组Xe核心，光追单元也砍掉了4组，频率降低50MHz，显存为8GB。

新一代的GPU均为图形核心、光线追踪核心以及AI人工智能三部分组成。Xe HPG同样如此，除了包办GPU 所需的Vector Engines，更具备AI 所需的XMX matrix engine 设计，同时具备独立的Ray-Tracing 单元，进一步整合Rasterization、Ray Tracing 的混合渲染功能。

简单来说，一组Xe核心等效于128个流处理器，包含一个原生的物理光线追踪单元，甚至我们大胆假设，以后Intel很可能会将更多的Xe核心封装到新的GPU上，从而通过更大的核心实现更强大的性能。

而Intel独有的XeSS 超解析度技术，同样也是一个AI深度学习与神经网络的应用。基于XMX指令单元：首先降低分辨率，进行渲染、前期处理，然后由XeSS介入，替代传统的TAA抗锯齿，再缩放提升分辨率，输出画面。

它不但支持Intel Arc系列显卡，也可用于任何支持Sahder Model 6.4的显卡，也就是说并不限于Intel自家和新显卡。

开箱赏析篇：

我手上的这一款ARC A750同样也是一块公版卡，包装和外观都是简约而具备Intel的经典VI，A750采用双风扇的设计，风扇采用了静音设计，即便在满载的时候，噪音也不会超过39分贝，正常电脑桌与座椅距离内基本听不到任何声音，配合上封闭式的机箱，哪怕深夜也不会影响睡眠。

显卡外观采用流线、圆润的黑化造型，表面材质触感像是肤质表面，搭配2 颗8.5cm、15 扇叶的风扇进行主动散热。

显卡长约26.5cm、占用2 个PCIe 插槽（含背板4cm 厚度）。显卡的侧面有着Intel Arc 的发光（白光）标志以及PCIe 8+6 pin 供电，满足显卡TBP 225W 的供电需求。

A750侧面有镀铬装饰条，金属质感十足。供电方面采用了8+6pin接口，功耗为225W，对于主流级别的用户来讲，500W的电源基本能够轻松胜任，没有什么太大的问题。也就是说，Intel的两款新显卡对于旧用户升级是非常友好的，只要电源额定功耗大于500W，并且平台为十代酷睿以后的尽可以直接换上新显卡进行升级。

唯一要注意的一点是Arc A770与A750显卡需要Resizable BAR或SAM功能的支持，英特尔强烈建议用户先检查、确定自己的电脑支持这项功能之后，再考虑选购其Arc系列显卡。

可能有很多朋友不了解“Resizable BAR”技术，下面简要介绍一下，在传统的基于Windows的计算机系统中，受限于PCIe的限制，处理器一次只能读取256MB显存。而随着显存容量和PCIe通道通信能力的提升，这一规范已经成为了制约性能的瓶颈。

显卡的背面则是横纹装饰设计，同时金属的背板的加持，更进一步提升显卡的颜值和质感，并且能够更好地保护PCB不会变形。而且A750的背面还有金色老虎纹，霸气十足。

装入机箱后，大家就更加能够体验到公版显卡的好处，只有两卡槽的厚度，而且重量不大，不会有下垂甚至拉裂PCB的隐患。

背板的虎头，妥妥地颜值担当。不仅仅美观，从实际使用中，背板的导热效果不俗，有利于提高系统的稳定性。

视频接口方面依旧是标准的 3 个 DP 2.0+1 个 HDMI 2.1，是目前最高端的搭配了，可以支持最高 8K 视频输出。

双风扇散热其实是一种合理性挺高的方案，既不会有太大的噪音，也不会增加太多的厚度和重量。比起散热，内部用料和做工才是更加重要的。

A750采用铜底均温板与GPU、VRAM 接触，并通过热导管将热引导致散热鳍片，在借由双风扇进行主动散热。显卡一样有着压铸铝合金中框，借由中框与PCIe 档板、电路板相互固定，提升电路板的强度随后再锁上散热器。

采用6 相VRM 供电，而GPU 周围则有8 颗GDDR6 内存。可以说，内部做工还是非常严谨的。

性能与体验：

测试之前，我们先来看看显卡的额GPU-z信息。可以看到，A750基于ACM-G10核心，具有28个Xe核心，相当于是448个流媒体，28个光线追踪单元（光追单元是软件无法检测的），112个纹理单元，224个光栅单元。8GB256bit位宽的GRR6显存，支持OpenGL、光线追踪、Vulkan等游戏API，并支持OpenCL、DirectML、DirectCompute三大通用计算。

我的测试平台是13代酷睿，可以看到所需的Resizable BAR也已经打开（BIOS默认打开）。

驱动版本方面，Intel先后推出了五版的驱动，为了方面大家感受其改进，我特意选取了最新版的4091以及发售后第二版的3082进行比较。当然了，除了官网下载更新外，Intel的显卡以及全系列版本都可以通过“英特尔驱动程序和支持助理”进行管理与更新，无需借助第三方工具，更快捷更纯净。

测试平台方面，采用了十三代酷睿i5 13400F处理器，搭载B760芯片组，DDR5 6000内存以及额定850W电源，并且显卡安装于第一根PCI-E 4.0 16x槽上面，并运行于PCI-E 4.0 16x模式。综上，足够满足Intel A750的性能全面发挥。

具体配置如下：

CPU:Intel i5 13400

主板：技嘉B760M小雕

内存：威刚XPG DDR5 6000 8GBX2

显卡:Intel ARC A750

硬盘：WD black SN750 1TB

散热器：威刚 240水冷

电源：威刚额定850W 80plus金牌认证全模组

机箱：威刚 XPG幻镜双侧透

1、3DMARK 理论测试

光线追踪测试

先来看看光线追踪测试场景Port Royal，旧版驱动是6532分，新版驱动是6558分，区别并不是很大，也就是说Intel驱动在光线追踪部分完善度不错。

另外一个光线追踪功能测试，旧版驱动是28.99帧，新版驱动是29.40，新版有小幅度提高，但可以说Intel显卡驱动的光线追踪一开始已经做的不错了。

Xess超解释度技术

作为Intel GPU的AI应用，3DMARK也是第一时间提供了支持和测试，通过测试我们可以看到，新老驱动在开启后均提升50%左右，关闭Xess为27帧，开启为41帧，同样是新驱动保持持续提升的趋势。

DX12测试

3DMARK的DX12测试有两个场景，Speed Way为新场景，测试速度更快负载更加高。旧驱动为2316分，新驱动为2345分，依然保持上升趋势。

另外一个DX12测试场景Time spy里面，新旧驱动几乎是一致的。

DX11测试场景Fire Strike场景EX模式也是类似，新旧驱动分数并没有明显的差别。

2、地铁：离去

经典光线追踪游戏地铁：离去，全开光线追踪特效后，1080P和2k分辨率下面A750分别取得了53帧和43帧，新老驱动差距不足0.3帧。

3、古墓丽影11：暗影

古墓丽影11：暗影是第一批支持Intel Xess技术的游戏，开启Xess后，游戏性能有明显的提高。

Xess和光线追踪同样是有多档可调的，开启Xess和光线追踪最高档后，1080P和2k分辨率下面A750分别取得了72帧和50帧，新老驱动差距不足1帧。但是关闭Xess后，1080P和2k分辨率分别下降4帧和3帧。

现有支持Xess技术的游戏大约是30款左右，受限于手上游戏有限，以后再给大家补上。

德军总部：新血脉

1080P和2k分辨率下面A750分别取得了194帧和125帧，新老驱动差距不足3帧。

小结：

不得不说，现在支持Xess技术的游戏并不算太多，所以多数的光线追踪游戏纯粹靠A750内部的28个光线追踪单元硬肝，然而在1080P和2K分辨率下面，都有不错的表现。相信3A大作通过后续更新支持Xess技术以后，性能会有进一步的提高。

值得一说的一点是，即使是发布第二版的3802版驱动，对于光线追踪和DX12方面的性能也已经展现非常好，新驱动有小幅度提高。一定程度来说，正面Intel的驱动方面完善程度比较高，并不会出现大家担心的新显卡各种经常抢救性升级的，debug一类的烦恼。

但是，不少老玩家提出一个疑问，新显卡会不会厚此薄彼，只优化新游戏，对于DX9级别的经典游戏视而不见呢？这一点分开两个方面看，一方面来说，DX9之前的老游戏部分已经不能被win11系统完美兼容，更别说能全部用上新显卡新架构；另外一方面，太老的游戏，尤其是DX7之前那种，建议大家放不下的话还是搞个虚拟机算了，压根就用不上啥显卡的，我好几个发小就是用虚拟机肝老版本的足球经理、星际争霸1之类的游戏。

那么对于坚守DX9经典游戏的有情怀玩家以及CSGO、LOL两大世界顶级电竞游戏来说，后面的测试才是你们关注的重点，通过两个版本驱动的比较，我们可以了解一下，Intel独显对于经典游戏的支持程度。

5、3DMARK06

3Dmark 06作为DX9基准测试的巅峰之作，所有测试都需要支持SM3.0的DirectX 9硬件，并且支持HDR特性，这款软件的最终得分里CPU性能占有不小的权重，因此它更适宜分析整个系统的3D加速能力。

当然了，现在我们的CPU基本上都是六核心以上，而且IPC性能也远非2006年的CPU可比，因此，CPU性能测试的部分建议忽略，我们单纯看图形性能即可。

有点意外的是，居然3802旧版驱动的得分是43458，而4903新版就破5万，可以看到，新版居然真的对于DX9特意有优化。

2、生化危机5

如果说基准测试不够直观的话，我们换一个经典游戏-生化危机5来看看。旧驱动综合成绩是242.1帧，而新驱动居然达到了344.6帧，差距居然达到100帧。看到这种结果，我还特意重新分别测试了3次，差距也就是3-5帧左右，整体维持原结果不变，看来Intel新驱动倒是认真对待老玩家了。

6、CSGO

下面是重头戏，FPS电竞大咖的最爱-CSGO。CSGO并没与自带benchmark，但我们可以通过回放进行赛事复盘，我选择的赛事就是2008年科隆大赛的第一场，通过微星小飞机软件进行监测。

左上角一排的数据第一个红色的是实时帧数，后面三个白色的分别是最小、平均、最高，其中平均值最具备参考价值。图片建议大家点击放大，看清楚。

旧驱动的平均帧数不到200，仅有197帧左右，但是新驱动可以轻轻松松破300帧，达到337帧左右。这样的差距比起生化危机5更加大。

7、LOL英雄联盟

LOL我采用的是实际进行游戏进行数据分析，同样也是通过小飞机进行监测。

对于游戏最重要的平均帧，旧驱动是138帧，新驱动是192帧，而且团战的时候也不会出现掉帧的问题（受限于技术只打匹配路人局，并没有遭遇到5v5的大作战，一般是3v3比较多）。

DX9小结：

测试前，我不过是打算了解一下兼容性而已，没想到实际的结果有点出人意料。Intel居然专门对于经典游戏和热门电竞进行了优化，CSGO还有一张Intel的新地图，看来Intel是打算迅速和电竞玩家打成一片。

总结：

其实特意把DX9部分独立出来的主要原因，就是针对于之前不少玩家对于新显卡只顾眼前人不顾旧人的担心。毕竟，厂家的精力是有限的，而且对游戏的兼容和优化会一定程度造就了驱动容量爆炸。Intel的驱动居然是1.2GB，其实就是包含了游戏优化的部分。

其实，对于本本用户来说，Intel驱动的用心倒是更加了解。过往核显的时代，每一次驱动更新，Intel都有详尽的说明是改进和优化了某一些游戏。也就是说，Intel做显卡和搞驱动并不是短期的。

单说intel锐炬，其实早在2012年就已经发布，甚至尝试过把大容量显存集成到CPU中。从五代酷睿5775C的性能表现来说是不错的，就是成本不占优。

而2020年锐炬升级为Xe结构后，就可以知道后面的事情必然是水到渠成的。ACM-G10 GPU可以说是Intel在GPU通用计算领域上面的初步收成，期望后续Xe结构继续发展，推出更强大的GPU，满足玩家更高的要求。

新未名空间

【显卡世界大变天】NAI 三家占比 82:9:9

【显卡世界大变天】NAI 三家占比 82:9:9

Re: 【显卡世界大变天】NAI 三家占比 82:9:9