首页>>新闻资讯>>行业动态

为何英伟达仍有更大上升空间?数据中心是主因

2024-09-03 09:20:26 13

引言

尽管 英伟达(Nvidia) 的市值表现令人印象深刻,但其股价仍有望继续走高。

该公司的 CUDA 软件可能是其持续成功的关键因素。

Nvidia 的数据中心机遇巨大,但可能被市场低估。

Nvidia 首席执行官黄仁勋指出,目前的数据中心尚未为 AI 做好准备,这将刺激 Nvidia 在未来几年内每年在产品和服务上的资本支出达到 2500 亿美元(且该数字还在增长),而 Nvidia 基本上是唯一一家在 数据中心AI 领域布局的公司。

大佬

为什么 CUDA 可能成为 Nvidia 的 iOS

2007 年,Nvidia 开发了统一计算设备架构(简称 CUDA,Compute Unified Device Architecture),以帮助其 GPU 并行计算非图形工作负载。简单来说,计算的主要方式是一次解决一个问题(顺序计算),Nvidia 不仅设计了 GPU,还构建了必要的架构,尝试解决真正大型的计算问题,方法是将问题分解为较小的问题并同时(或并行)解决所有问题。同样,用非常基本的术语来说,CUDA 是一种软件,可以帮助开发人员告诉机器他们想要使用硬件进行并行计算(这对于 AI 工作负载是必需的)。

这款软件的开发考虑了 Nvidia 的 GPU,反之亦然。由于 Nvidia 起步较早,CUDA 成为了训练 AI 模型的首选编程平台。因此,那些喜欢使用 CUDA 的人必须使用 NVIDIA GPU,而那些使用该公司 GPU 的人最好使用 CUDA,从而为 Nvidia 创造了一个良性循环。

这是 Nvidia 牛市论证的关键部分,与苹果的 iPhone 有相似之处。多年来,苹果的市盈率高达 10 倍,前提是它只是一家硬件公司,理论上最终会有人制造出更具吸引力或更便宜的硬件并赢得所有市场份额。正是因为 iOS,这种威胁从未成为现实。同样,对于 Nvidia 来说,它不再是制造更好或更便宜的芯片,竞争对手还必须解决等式中的软件部分。这可以说是与 Nvidia 竞争最困难的部分,因为这个过程耗费的时间越长,Nvidia 的地位就会越稳固。

如果你思考一下苹果的业务,就会发现它是一条双头龙。你购买 iPhone,这是一款优质的硬件,而苹果则通过其 iOS 和软件向你推销服务。支持 iOS 还意味着购买 iPhone 的消费者不太可能更换,而是会购买其他苹果硬件产品,从而形成消费者锁定。同样,对于 Nvidia,消费者今天购买 GPU 是因为它们被认为是市场上最好的。但激活这些 GPU 的功能还需要一个软件组件。正是 Nvidia 在 CUDA 方面的领导地位保持了其竞争优势。与苹果一样,当消费者需要升级 GPU 时,他们会坚持使用 Nvidia,因为 CUDA 只适用于 Nvidia。如果他们想要 AMD,他们将不得不学习其计算软件并切换他们创建的训练模型,这会产生与苹果消费者面临的类似高昂的转换手机设备成本。

Nvidia 的数据中心机遇巨大

要了解 Nvidia 的机会有多大,一个简单的方法就是看看人工智能初创公司 CoreWeave。由于是 Nvidia GPU是其主要供应商之一,该公司的估值在几周前跃升至 190 亿美元。以下是该公司博客中的一段有趣内容:

“我们的 GPU 机群拥有超过 45,000 台 GPU,是北美最大的 GPU 私人运营商。我们的 GPU 基础设施由位于芝加哥、北卡罗来纳州、新泽西州和纽约的 5 个数据中心提供,可与大型云计算公司运营的资产相媲美。”

对于运行 AI 工作负载所需的数据中心类型来说,这意味着大约需要 9,000 个 GPU。美国国际贸易委员会估计,2021 年全球大约有8,000 个数据中心。现在,如果你相信 AI 是新的互联网,那么这 8,000 个数据中心将针对 AI 工作负载进行改进。这意味着 7200 万个 GPU,而且这还没有计算数据中心数量增长,这似乎注定会发生。以每张 GPU 至少30,000 美元的成本计算,GPU 销售额约为 2.2 万亿美元。当然,随着 GPU 的不断改进,对 GPU 的需求将减少。但数据中心的增长和 GPU 单价的上涨将远远抵消这一增长。

最近报道称,Nvidia 拥有80% 的 AI 芯片份额。这意味着 Nvidia 可能会获得 1.8 万亿美元的销售额,利润率极高。这还只是数据中心收入,不包括游戏等垂直行业。

竞争时代即将来临

有迹象表明,Nvidia 的主导地位将受到挑战。第一个挑战者可能是 Apple Intelligence。Apple Intelligence 对 Nvidia 构成威胁的主要原因有两个。首先,苹果公司 ( AAPL ) 将使用自己的芯片,这意味着即使人工智能成为新的互联网,Nvidia 也不会进入苹果设备。第二个问题是,苹果将在该设备上完成部分(如果不是大部分)人工智能工作负载。这意味着,如果公司采用本质上是一种边缘人工智能,Nvidia GPU 的使用量可能会低于预期,因为 Nvidia 的 GPU 主要用于数据中心。

另一个需要警惕的问题是销售集中度。有一位神秘客户占了Nvidia 销售额的很大一部分:

对一位客户(客户 A)的销售额占 2024 财年总收入的 13%,这归因于计算和网络部门。一位间接客户主要通过系统集成商和分销商(包括通过客户 A)购买我们的产品,估计占 2024 财年总收入的约 19%,这归因于计算和网络部门。我们估计的计算和网络需求预计将保持集中。2023 财年和 2022 财年没有客户占总收入的 10% 或以上。

从某种程度上来说,这是“人工智能是新互联网”这一论点有效性的重要指标。如果这一论点成立,那么随着所有人都接受人工智能,销售集中度应该会随着时间的推移而下降。如果不是,那么集中度应该会持续下去,而 Nvidia 将受制于这个客户。投资者必须关注这一指标。

AMD Inc. ( AMD ) 和英特尔公司 ( INTC ) GPU的增长也是一种威胁,因为他们使用自己的竞争编程平台,如果 CUDA 起飞,从长远来看会削弱 CUDA。例如,OpenAI 推出了自己的CUDA 替代品。与此同时,Meta 推出了增强 Nvidia 和 AMD GPU 之间互操作性的软件,此举旨在削弱 CUDA。路透社报道:

软件已成为芯片制造商寻求建立开发者生态系统以使用其芯片的关键战场。迄今为止,Nvidia 的 CUDA 平台一直是人工智能领域最受欢迎的平台。

然而,一旦开发人员为 Nvidia 芯片定制代码,就很难在 AMD 等 Nvidia 竞争对手的图形处理单元 (GPU) 上运行。Meta 表示,该软件旨在轻松在芯片之间切换,而不会受到锁定。

关于GPU与数据中心的全球研究情况

论文发表情况:全球总共发表了超过1000篇相关的研究论文,近年来发表的论文数量逐渐增加,显示出研究热度增加;

图,关于GPU与数据中心的论文发表情况

全球研究机构在GPU与数据中心领域的论文发表数量

从下表和下图可以看出中国研究机构在GPU与数据中心领域的论文发表数量最多,而作为全球GPU技术应用领域的领头羊公司的英伟达(Nvidia)竟然没进排名前15,显示出应用与研究之间的脱节。

图,研究机构在GPU与数据中心领域的论文发表数量

在GPU与数据中心的研究领域引用次数最多的论文:

论文标题

发表时间

引用次数

ICML - Deep speech 2: end-to-end speech recognition in English and mandarin

2016

1492

Towards 6G wireless communication networks: vision, enabling technologies, and new paradigm shifts

2020

1054

A comprehensive survey on machine learning for networking: evolution, applications and research opportunities

2018

694

FPGA - ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA

2017

555

DarkSide-20k: A 20 tonne two-phase LAr TPC for direct dark matter detection at LNGS

2018

510

The Stratosphere platform for big data analytics

2014

420

Visualization of image data from cells to organisms

2010

245

A Survey of Data-Intensive Scientific Workflow Management

2015

233

Visualizing Big Data with augmented and virtual reality: challenges and research agenda

2015

228

Programmable phase-change metasurfaces on waveguides for multimode photonic convolutional neural network.

2021

218

Deep Speech 2: End-to-End Speech Recognition in English and Mandarin

2015

205

DianNao family: energy-efficient hardware accelerators for machine learning

2016

168

Numerical modeling of subaerial and submarine landslide-generated tsunami waves—recent advances and future challenges

2016

160

State-of-the-art SPH solver DualSPHysics: from fluid dynamics to multiphysics problems.

2021

150

Big data management in the mining industry

2020

149

The state of the art and taxonomy of big data analytics: view from new big data framework

2019

149

Multi-sensor cloud and cloud shadow segmentation with a convolutional neural network

2019

143

An efficient Swarm-Intelligence approach for task scheduling in cloud-based internet of things applications

2018

139

CCS - Rendered Insecure: <span class=\highlight\">GPU</span> Side Channel Attacks are Practical"

2018

127

The Geodesist’s Handbook 2016

2016

124

A case study of conditional deep convolutional generative adversarial networks in machine fault diagnosis

2020

121

A survey on particle swarm optimization with emphasis on engineering and network applications

2019

118

Time series joins, motifs, discords and shapelets: a unifying view that exploits the matrix profile

2017

96

Neuroinspired unsupervised learning and pruning with subquantum CBRAM arrays

2018

90

High-performance computing: the essential tool and the essential challenge

2017

87

Deep reinforcement learning in fluid mechanics: A promising method for both active flow control and shape optimization

2020

83

Evaluation and Mitigation of Radiation-Induced Soft Errors in Graphics Processing Units

2016

82

BOINC: A Platform for Volunteer Computing

2019

80

Using parallel & distributed computing for real-time solving of vehicle routing problems with stochastic demands

2011

78

EuroSys - Balancing efficiency and fairness in heterogeneous <span class=\highlight\">GPU</span> clusters for deep learning"

2020

77

图,在GPU与数据中心研究领域被引用次数最多的研究论文

GPU与数据中心技术涉及到的关键研究领域

在GPU与数据中心技术涉及到的关键研究领域除了计算机科学外还有操作系统,云计算,分布式计算,AI以及并行计算等研究课题;

涉及到的关键研究领域

论文数量

Computer science

计算机科学

1041

Operating system

操作系统

326

Cloud computing

云计算

277

Distributed computing

分布式计算

274

Artificial intelligence

人工智能

249

Parallel computing

并行计算

231

Embedded system

嵌入式系统

174

Engineering

工程

145

Data center

数据中心

134

Field-programmable gate array

现场可编程门阵列

129

Mathematics

数学

120

Scalability

可扩展性

113

Computer architecture

计算机架构

111

Efficient energy use

高效能源利用

111

Computer network

计算机网络

108

Server

服务器

104

Physics

物理

103

Machine learning

机器学习

91

Energy consumption

能源消耗

88

Software

软件

88

Algorithm

算法

77

CUDA

CUDA

77

Scheduling (computing)

调度(计算)

77

Deep learning

深度学习

75

Telecommunications

电信

72

Biology

生物学

70

Supercomputer

超级计算机

70

Electrical engineering

电气工程

69

Artificial neural network

人工神经网络

67

Big data

大数据

66

图,GPU与数据中心涉及到的关键研究领域

相关标签:

发表评论:

评论记录:

未查询到任何数据!