#21 Re: GPU得寿命我比较清楚,一般是3-3-5
川小小 写了: 2025年 11月 14日 22:03我们原来的服务器就是放在硬件lab里,就是普通室温,而且机箱就是普通铁皮机箱,散热条件比现在放GPU server的data center差多了。
Intel的服务器CPU设计就温度低
我台式机也用Xeon,弄个10美元的风扇,温度只有40-50几度
GPU这样运行嫌弃铜管散热不行,还要水冷的,肯定寿命不行
川小小 写了: 2025年 11月 14日 22:03我们原来的服务器就是放在硬件lab里,就是普通室温,而且机箱就是普通铁皮机箱,散热条件比现在放GPU server的data center差多了。
Intel的服务器CPU设计就温度低
我台式机也用Xeon,弄个10美元的风扇,温度只有40-50几度
GPU这样运行嫌弃铜管散热不行,还要水冷的,肯定寿命不行
CPU server 5年问题不大
芯片寿命主要受到温度影响
工作温度超过50度,温度每上升10度,芯片寿命减10倍
我最早做过基站,用的是PowerPC。很多野外的基站就放在小破房间里,根本没有空调,白天里面5,60度甚至更高是常事。很多基站能用到10年。
你怎么分不清环境温度,和芯片内部温度?
环境温度和芯片内部温度有啥关系,影响寿命的是芯片内部温度
powerpc芯片温度很低的
环境温度高芯片内部温度能低吗?
你搞不清芯片内部热量来源?
赖美豪中 写了: 2025年 11月 14日 11:50数据中心用3年,然后流入一些小作坊再用3年,然后流入民间再5年. 比如大部分a100仍是很多企业自营data center得主力。今年才会换h100
你丫就一文盲,屁都不懂只靠嘴炮
大型云厂里面的GPU坏的概率很高,我们有一整套流程怎么处理这些坏掉的GPU,但只要没坏的,还有客户在用,就会留在平台上继续租
像V100,上市已经8年了,算力不高但很便宜,还有很多客户想用,我们就一直没办法retire它,support什么的都要跟上