川小小 写了: 2025年 11月 14日 22:03我们原来的服务器就是放在硬件lab里,就是普通室温,而且机箱就是普通铁皮机箱,散热条件比现在放GPU server的data center差多了。
Intel的服务器CPU设计就温度低
我台式机也用Xeon,弄个10美元的风扇,温度只有40-50几度
GPU这样运行嫌弃铜管散热不行,还要水冷的,肯定寿命不行
版主: 牛河梁

大型云厂里面的GPU坏的概率很高,我们有一整套流程怎么处理这些坏掉的GPU,但只要没坏的,还有客户在用,就会留在平台上继续租
像V100,上市已经8年了,算力不高但很便宜,还有很多客户想用,我们就一直没办法retire它,support什么的都要跟上