j9九游会新闻

j9九游会

当前位置: 首页 > j9九游会新闻

j9九游会新闻

首页 > j9九游会新闻

九游会j9网站首页:一文了解国产AI芯片和英伟达的差距有多大

作者:j9九游会发布时间:2025-01-13

  一、英伟达AI芯片的优势分析

  从最终用户的视角对英伟达GPU产品优势的评价,可概况为如下5点;

  好用:从芯片性能角度市场top1,不接受反驳。易用:CUDA生态配套工具齐全,上手无压力。都在用:产品案例多、成熟度强,市场认可度高。各类场景都能用:产品布局全,各类场景都有高中低产品对应。不同规模都能用:扩展性强,支持大规模集群扩展,千卡、万卡、十万卡,统统不在话下。九游会j9官网真人游戏第一品牌

  二、国内英伟达和国产芯片的市占率情况

  今年最新数据暂时没找到,下图是IDC公布的去年H1国内AI芯片出货量情况,可以看到英伟达市的出货量占据主导地位,市占率高达90%,总出货量为51万片,其中英伟达为46万片,华为近4万片,其他品牌总计在1万片多一点, 国产芯片排名靠前的分别为HW、昆仑芯和寒武纪等。

  (图片可放大看)

一文了解国产AI芯片和英伟达的差距有多大

  三、单芯片性能层面的对比

  单卡性能差距集中在芯片算力(以FP16为例)、显存大小和显存类型、显存带宽、AI芯片间互联带宽等,如下2个截图有详细展示,大家自行查看:

  1、英伟达在售或者即将发售的旗舰GPU产品

  2、国产在售的主流AI芯片(部分)参数情况

  四、单台八卡机整机的性能对比

  除了整机计算性能差距外,虽然都是八卡整机,但是在其他规格方案也有差异,主要集中在芯片互联和网卡配置,英伟达H100整机标配8张cx7的400G网卡,而HW的ST八卡机是8张200G网卡,摩尔仅配置2张400G;

  HW ST OAM八卡机的基本配置如下:

  摩尔 S4000 OAM八卡机的内存和网卡配置(截图于其官网视频):

  五、AI芯片生态层面差距分析

  芯片性能是纸面参数,生态的成熟是决定用户能否真正用起来的关键,英伟达CUDA生态发展了十余年成熟度和客户使用覆盖度都是最优的,国内AI芯片想突破英伟达壁垒主要是两类路线,分布式兼容或者构建自有生态,天数、摩尔线程、海光DCU以兼容Cuda为主,而寒武纪、昆仑芯、昇腾、燧原、算能等则是构建自有软件栈,还有很长的路要走。

  下图为寒武纪的软件栈布局(供参考)

  六、大规模集群(千卡-万卡)实际落地方面差距巨大

  近2年以来,大模型训练相关的需求激增,对应的AI服务器集群规模也越来越大。规模增大对GPU集群的真实效率和稳定性提出了更高要求。放眼全球,OpenAI、微软、xAI 和 Meta 在内的多个头部公司都在争相建立超过 10 万卡的GPU 集群,其中马斯克宣布在短短122天内建设10万张英伟达H100卡的Colossus集群,全球AI算力的竞争进入了全新阶段。

  据已公开的信息,国内最大规模以万卡集群为主,前几天看新闻报道,百度升级AI异构计算平台百舸4.0,具备了10万卡集群部署和管理能力,个人认为国内万卡到十万卡依然需要依赖英伟达的GPU。从国产AI芯片的角度,千卡集群不完全成熟(看不到落地实际案例,建好用不起来的除外),国产AI芯片厂商依然在宣传千卡集群(如下截图)j9九游会

13244776666

J9GamingNo1@LiveGameBrand.com