首页 >> 通信 >> 英伟达25年路线图惊爆流出!老黄豪赌B100暴打AMD,秘密武器X100登出

英伟达25年路线图惊爆流出!老黄豪赌B100暴打AMD,秘密武器X100登出

2024-02-01 通信

,AMD和NVIDIA在PCIe6.0应用软件上还远超落后。而即使英伟达自己的内外团队,也未作准备用于PCIe6.0CPU。

此外,他们还将用于低速较慢的C2C式直择向。

在以后,ConnectX-8就会配备一款应用软件的PCIe6.0集线器,但在此之前还没有人作准备。

近日,海内和AsteraLabs要到年底才能作准备原型车的PCIe6.0直择时器,而毕竟这些主机板的尺寸,所即可的直择时器只就会格外多。

这也显然,原本的B100将被限制在3.2T,用于ConnectX-7时的低速也显然是400G,而非英伟达在PPT上所声称的每个GPU 800G。

如果保持稳择空气冷却,电源、PCIe和网络服务低速定值,那无论是制造还是协同作战,都就会很容易。

稍后,英伟达就讲话架一个无即可水冷的1,000W+原版本B100。

这一原版B100将通过ConnectX-8,为每个GPU一共享完备的800G网络服务连接。

对于TCP/InfiniBand,这些SerDes依然是8x100G。

虽然每个GPU的网络服务低速降低了一倍,但可有却减半了,因为它们仍即可通过完全一致的51.2T集线器。而102.4T集线器,在B100前代中的将不日后用于。

引人入胜的是,有报载称B100上的NVLink框架将转用224G SerDes,如果英伟达真能来作到这一点,无疑是有限的不断进步。

大多数人业内专业人士都或许,224G极为可靠,2024年必定能就会来作到,但英伟达的人除外。

要告诉,无论是Google、Meta,还是南美,他们的224G AI核物理原型车前提都择在2026/2027年。

如果英伟达在2024/2025年就来作到了这一点,铁择就会把宿敌们打得落花流水。

近日,B100依然是宏碁的N4P,而不是基于3nm手工的新技术。

确实,对于如此大的CPU尺寸,宏碁的3nm手工即已已成熟。

根据英伟达主机板供给商Ibiden声称的主机板尺寸,英伟达却是依然转而转用由2个单片大CPUMCM都是由的内部设计,包括8或12个HBM切割。

SambaNova和NVIDIA去年的CPU,都转用了相似的巨观内部设计。

英伟达之所以未像AMD那样用于混合键合新技术,是因为他们无即可原型车,而效率就是他们的一个大顾虑。

据SemiAnalysis估测,这两款B100CPU的内存容量将与AMD的MI300X相数或较好,近乎24GB切割。

水冷式原版B100的低速最重6.4Gbps,而液冷原版可能就会高9.2Gbps。

另外,英伟达还在上图中的展示了GB200和B40。

GB200和GX200都用于了G,确实这是一个占位符,因为英伟达将上架基于ArmCore的另行CPU。极为就会曾一度用于Grace。

B40很可能就会只是B100的一半,只有一个单片N4PCPU,和最多4或6层的HBM。与L40S多种不同,这对于小假设的推理是很有意味的。

‘X100’:致命一击

曝出的上图中的最惹人注意的,就是英伟达的‘X100’日程了。

引人入胜的是,它与AMD在此之前的MI400日程完全可信。就在H100上架一年后,AMD面世了MI300X战略性。

AMD给MI300X的积体电路令人评语动人,他们大量装入了格外多的计算和内存,希望能近乎一年前的H100,从而在纯嵌入式上近乎英伟达。

英伟达也发现了,他们两年一次面世另行GPU的人声,给了垄断宿敌明朗的机就会抢夺低价。

索性缓了的英伟达,悄悄把复刻原版产品间隔放缓到每年一次,不给宿敌任何机就会。比如,他们计划书于2025年上架‘X100’,显然比B100稍即已一年。

当然,‘X100’在此之前还仍未原型车(不像B100),所以一切还悬而未决。

要告诉,在依然,英伟达可没有人就会讨论;也复刻原版产品后来的复刻原版产品,这次依然是史无前例了。

而且,名称大均值也不叫‘X100’。

英伟达长期以来的现代,都是以Ada Lovelace、Grace Hopper和Elizabeth Blackwell等杰出女研究者小组的名称来定名为GPU的。

至于‘X’,唯一符合逻辑的就是研究者半导体元器件和金属带在结构上的Xie Xide,但毕竟她的此前,均值应该不大。

低价营销大师:老黄的豪赌

自英伟达亦然式成立之初,黄仁勋就长期在尽力推展着对低价营销的把持,从而拥护有限的激增前提。

他们不仅情愿肩负必定作废的采购——高111.5亿美元的供货、生产并能和供给允诺,并且还有38.1亿美元的预付款协约。

可以告诉,未数家供给商能与之相提并论。

而英伟达的记事也不止一次证明,他们可以在供给短缺时创造性地降低供给量。

1997年,张忠谋和我偶遇时,只有100人的英伟达在那一年收尾了2700万美元的收入。

你们可能就会不或许,但张忠谋以前偶尔打电话推销,并且还就讲话四门探访。而我则就会向张忠谋推论英伟达是来作什么的,以及我们的CPU尺寸无即可显然,而且每年都就会日渐大。

不久,英伟达一共计来作了1.27亿个晶圆。即已先,英伟达每年激增数100%,直到如今。也就是在依然10年中的,复合年激增率近乎了70%左右。

当时,张忠谋未能或许英伟达无即可如此多的晶圆,但黄仁勋坚称了依然。

英伟达通过在供给全面性的标新立异为了让,赢得了有限尝试。虽然偶尔要减记商业价值数十亿美元的供给,但他们依然从过度的定购中的得到了亦然收益。

这次,英伟达如此一来抢占了GPU中下游框架的大大多供给——

他们向SK海力士、华为和台积电这3家HBM供给商下了非常大的采购,挤占了除海内和Google之外其他没有人的供给。同时,还买下了宏碁CoWoS的大大多供给,以及Amkor的生产并能。

此外,英伟达还充分来进行了HGX板卡和卖家端所即可的下游框架,如直择时器、DSP、显微镜元器件等。

如果供给商对英伟达尽快置若罔闻,那么就就会面对老黄的‘芝麻加大棒’——

一全面性,他们就会从英伟达得到更糟的采购;另一全面性,他们可能就会就会被英伟达从除此以外的低价营销中的移出。

当然,英伟达也只有在供给商至关直要且未能被淘汰或多元性供给的情况下,才就会用于允诺和必定作废的采购。

每个供给商却是都或许自己是AI的赢家,大多缘故是因为英伟达向所有供给商都下了大量的采购,而他们也都或许自己夺下了大大多金融业务。但也就是说上,只是因为英伟达的激增低速太快了。

回到低价动态上,虽然英伟达的前提是在去年来作到最少700亿美元的数据中的心卖出额,但只有Google在中下游有够大的生产并能——包括最少100万台的设备。AMD在AI层面的总生产并能依然非常受限,高于也不过几十万台。

商业作法:潜在的反垄断

看做,英伟达悄悄来进行对GPU的有限生产力,来向卖家推销和交叠卖出复刻原版产品。

低价营销中的有大量数据声称,英伟达就会根据一复刻原版因素向某些母公司一共享适当相应。有数但不限于:多元性供货计划书、全方位一共同开发AICPU计划书、买到英伟达的DGX、NIC、集线器和/或电子元件等。

事实上,英伟达的锁链卖出非常尝试。尽管之前只是数家覆盖面很小的电子元件接收器供给商,但他们的货运量在一个月份内激增了两倍,预计去年的销售量将最少10亿美元——远超最少了自家GPU或网络服务CPU金融业务的激增低速。

这些作法,可以告诉是比较缜密。

比如,希望要在英伟达的的系统上来作到3.2T网络服务和可靠的RDMA/RoCE,唯一步骤就是用于英伟达的NIC。当然,一全面性也是因为NVIDIA、AMD和海内的复刻原版产品实在是依赖垄断力——依然停留在200G的素质上。

而通过对低价营销的管理,英伟达还促使400G InfiniBand NIC的交付间隔,都能比400GTCPNIC明显缩短。而这两种NIC(ConnectX-7)在CPU和芯片内部设计上,也就是说上是完全完全一致的。

其缘故在于英伟达的SKU可用,而非也就是说的低价营销瓶颈——迫使大企业迫使买到效率较好的InfiniBand集线器,而不是标准的TCP集线器。

这还不止,看看低价营销对L40和L40S GPU有多么很感兴趣,就告诉英伟达又在相应上来作手脚了——为了夺下格外多H100的相应,OEM厂家就无即可买到格外多的L40S。

这与英伟达在PC层面的加载,也是如出一辙——黑板制造商和AIB合作伙伴只能买到格外大量的G106/G107(中的/入四门级GPU)才能得到格外稀缺、较好盈利的G102/G104(入四门级和舰长GPU)。

作为因应,低价营销中的的人也被灌输了这样的告诉法——L40S比A100较好,因为它不具备较好的FLOPS。

但也就是说上,这些GPU极为较难LLM推理,因为它们的SRAM信道还不到A100的一半,而且也未NVLink。

这显然在L40S上运行LLM并来作到良好的TCO却是是必定能就会的,除非是非常小的假设。而大批量的妥善处理也就会引发相应到每个普通用户上的token/s却是是必定用的,从而使理论上的FLOPS在也就是说领域中的似乎毫无用处。

此外,英伟达的MGX管理系统平台,虽然可用了卖家端内部设计的艰不解临时工,但也同时降低了OEM的盈利率。

戴尔、新技术公司和暗喻等母公司确实对MGX持阻挠态度,但诸如超微、广达、VAIO、技嘉等母公司则频频补齐这一补齐,将低效率的‘大企业智能’新新技术。

而这些参与L40S和MGX炒作的OEM/ODM,也可以从英伟达那里得到较好的两条线GPU复刻原版产品相应。

光电一共积体电路(Co-Packaged Optics)

在CPO全面性,英伟达也是比较直视。

他们长期在研究者各种解决设计方案,有数来自Ayar Labs的解决设计方案,以及他们自己从Global Foundries和宏碁得到的解决设计方案。

在此之前,英伟达依然勘查了几家始创母公司的CPO设计方案,但于是在还未来作出事与愿违的决择。

深入研究者或许,英伟达很或许就会将CPO应用软件到‘X100’的NVSwitch上。

因为如此一来应用软件到GPU本身可能就会效率太高,而且在实用性全面性也很十分困难。

折射集线器(Optical Circuit Switch)

Google在智能基础设施全面性最大的压倒性之一,就是它的折射集线器。

确实,英伟达也在执着相似的东西。在此之前,他们依然注意到了多家母公司,希望都能进行合作开发。

英伟达预见,Fat Tree在一直扩展全面性依然跑到了天涯海角,因此无即可另一种上同调在结构上。

与Google可选择6D Torus多种不同,英伟达格外偏向于转用Dragonfly在结构上。

据认识,英伟达距离OCS的销售还遥遥无期,但他们希望在2025努瓦都能日渐接数这一前提,但大均值未能来作到。

OCS + CPO是圣杯,众所周知是当OCS可以来作到按发送者交换时,将就会如此一来改变游戏规则。

不过,在此之前还未人展示过这种并能,甚至连Google也未。

虽然英伟达的OCS和CPO还只是研究者部四门的两套PPT,但深入研究者专业人士或许,CPO就会在2025至2026短期内离复刻原版产品化格外进一步。(花旗银行所见所闻)

胸腺法新打多久起效
普乐安片和坦洛新可以同时吃吗
鼾症吃什么药效果最好
止泻药有哪些常备药
骶髋骨关节炎怎么治疗
友情链接