尽管 英伟达(Nvidia) 的市值表现令人印象深刻,但其股价仍有望继续走高。
该公司的 CUDA 软件可能是其持续成功的关键因素。
Nvidia 的数据中心机遇巨大,但可能被市场低估。
Nvidia 首席执行官黄仁勋指出,目前的数据中心尚未为 AI 做好准备,这将刺激 Nvidia 在未来几年内每年在产品和服务上的资本支出达到 2500 亿美元(且该数字还在增长),而 Nvidia 基本上是唯一一家在 数据中心AI 领域布局的公司。
大佬
2007 年,Nvidia 开发了统一计算设备架构(简称 CUDA,Compute Unified Device Architecture),以帮助其 GPU 并行计算非图形工作负载。简单来说,计算的主要方式是一次解决一个问题(顺序计算),Nvidia 不仅设计了 GPU,还构建了必要的架构,尝试解决真正大型的计算问题,方法是将问题分解为较小的问题并同时(或并行)解决所有问题。同样,用非常基本的术语来说,CUDA 是一种软件,可以帮助开发人员告诉机器他们想要使用硬件进行并行计算(这对于 AI 工作负载是必需的)。
这款软件的开发考虑了 Nvidia 的 GPU,反之亦然。由于 Nvidia 起步较早,CUDA 成为了训练 AI 模型的首选编程平台。因此,那些喜欢使用 CUDA 的人必须使用 NVIDIA GPU,而那些使用该公司 GPU 的人最好使用 CUDA,从而为 Nvidia 创造了一个良性循环。
这是 Nvidia 牛市论证的关键部分,与苹果的 iPhone 有相似之处。多年来,苹果的市盈率高达 10 倍,前提是它只是一家硬件公司,理论上最终会有人制造出更具吸引力或更便宜的硬件并赢得所有市场份额。正是因为 iOS,这种威胁从未成为现实。同样,对于 Nvidia 来说,它不再是制造更好或更便宜的芯片,竞争对手还必须解决等式中的软件部分。这可以说是与 Nvidia 竞争最困难的部分,因为这个过程耗费的时间越长,Nvidia 的地位就会越稳固。
如果你思考一下苹果的业务,就会发现它是一条双头龙。你购买 iPhone,这是一款优质的硬件,而苹果则通过其 iOS 和软件向你推销服务。支持 iOS 还意味着购买 iPhone 的消费者不太可能更换,而是会购买其他苹果硬件产品,从而形成消费者锁定。同样,对于 Nvidia,消费者今天购买 GPU 是因为它们被认为是市场上最好的。但激活这些 GPU 的功能还需要一个软件组件。正是 Nvidia 在 CUDA 方面的领导地位保持了其竞争优势。与苹果一样,当消费者需要升级 GPU 时,他们会坚持使用 Nvidia,因为 CUDA 只适用于 Nvidia。如果他们想要 AMD,他们将不得不学习其计算软件并切换他们创建的训练模型,这会产生与苹果消费者面临的类似高昂的转换手机设备成本。
要了解 Nvidia 的机会有多大,一个简单的方法就是看看人工智能初创公司 CoreWeave。由于是 Nvidia GPU是其主要供应商之一,该公司的估值在几周前跃升至 190 亿美元。以下是该公司博客中的一段有趣内容:
“我们的 GPU 机群拥有超过 45,000 台 GPU,是北美最大的 GPU 私人运营商。我们的 GPU 基础设施由位于芝加哥、北卡罗来纳州、新泽西州和纽约的 5 个数据中心提供,可与大型云计算公司运营的资产相媲美。”
对于运行 AI 工作负载所需的数据中心类型来说,这意味着大约需要 9,000 个 GPU。美国国际贸易委员会估计,2021 年全球大约有8,000 个数据中心。现在,如果你相信 AI 是新的互联网,那么这 8,000 个数据中心将针对 AI 工作负载进行改进。这意味着 7200 万个 GPU,而且这还没有计算数据中心数量增长,这似乎注定会发生。以每张 GPU 至少30,000 美元的成本计算,GPU 销售额约为 2.2 万亿美元。当然,随着 GPU 的不断改进,对 GPU 的需求将减少。但数据中心的增长和 GPU 单价的上涨将远远抵消这一增长。
最近报道称,Nvidia 拥有80% 的 AI 芯片份额。这意味着 Nvidia 可能会获得 1.8 万亿美元的销售额,利润率极高。这还只是数据中心收入,不包括游戏等垂直行业。
有迹象表明,Nvidia 的主导地位将受到挑战。第一个挑战者可能是 Apple Intelligence。Apple Intelligence 对 Nvidia 构成威胁的主要原因有两个。首先,苹果公司 ( AAPL ) 将使用自己的芯片,这意味着即使人工智能成为新的互联网,Nvidia 也不会进入苹果设备。第二个问题是,苹果将在该设备上完成部分(如果不是大部分)人工智能工作负载。这意味着,如果公司采用本质上是一种边缘人工智能,Nvidia GPU 的使用量可能会低于预期,因为 Nvidia 的 GPU 主要用于数据中心。
另一个需要警惕的问题是销售集中度。有一位神秘客户占了Nvidia 销售额的很大一部分:
对一位客户(客户 A)的销售额占 2024 财年总收入的 13%,这归因于计算和网络部门。一位间接客户主要通过系统集成商和分销商(包括通过客户 A)购买我们的产品,估计占 2024 财年总收入的约 19%,这归因于计算和网络部门。我们估计的计算和网络需求预计将保持集中。2023 财年和 2022 财年没有客户占总收入的 10% 或以上。
从某种程度上来说,这是“人工智能是新互联网”这一论点有效性的重要指标。如果这一论点成立,那么随着所有人都接受人工智能,销售集中度应该会随着时间的推移而下降。如果不是,那么集中度应该会持续下去,而 Nvidia 将受制于这个客户。投资者必须关注这一指标。
AMD Inc. ( AMD ) 和英特尔公司 ( INTC ) GPU的增长也是一种威胁,因为他们使用自己的竞争编程平台,如果 CUDA 起飞,从长远来看会削弱 CUDA。例如,OpenAI 推出了自己的CUDA 替代品。与此同时,Meta 推出了增强 Nvidia 和 AMD GPU 之间互操作性的软件,此举旨在削弱 CUDA。路透社报道:
软件已成为芯片制造商寻求建立开发者生态系统以使用其芯片的关键战场。迄今为止,Nvidia 的 CUDA 平台一直是人工智能领域最受欢迎的平台。
然而,一旦开发人员为 Nvidia 芯片定制代码,就很难在 AMD 等 Nvidia 竞争对手的图形处理单元 (GPU) 上运行。Meta 表示,该软件旨在轻松在芯片之间切换,而不会受到锁定。
论文发表情况:全球总共发表了超过1000篇相关的研究论文,近年来发表的论文数量逐渐增加,显示出研究热度增加;
图,关于GPU与数据中心的论文发表情况
全球研究机构在GPU与数据中心领域的论文发表数量
从下表和下图可以看出中国研究机构在GPU与数据中心领域的论文发表数量最多,而作为全球GPU技术应用领域的领头羊公司的英伟达(Nvidia)竟然没进排名前15,显示出应用与研究之间的脱节。
图,研究机构在GPU与数据中心领域的论文发表数量
在GPU与数据中心的研究领域引用次数最多的论文:
论文标题
发表时间
引用次数
ICML - Deep speech 2: end-to-end speech recognition in English and mandarin
2016
1492
Towards 6G wireless communication networks: vision, enabling technologies, and new paradigm shifts
2020
1054
A comprehensive survey on machine learning for networking: evolution, applications and research opportunities
2018
694
FPGA - ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA
2017
555
DarkSide-20k: A 20 tonne two-phase LAr TPC for direct dark matter detection at LNGS
2018
510
The Stratosphere platform for big data analytics
2014
420
Visualization of image data from cells to organisms
2010
245
A Survey of Data-Intensive Scientific Workflow Management
2015
233
Visualizing Big Data with augmented and virtual reality: challenges and research agenda
2015
228
Programmable phase-change metasurfaces on waveguides for multimode photonic convolutional neural network.
2021
218
Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
2015
205
DianNao family: energy-efficient hardware accelerators for machine learning
2016
168
Numerical modeling of subaerial and submarine landslide-generated tsunami waves—recent advances and future challenges
2016
160
State-of-the-art SPH solver DualSPHysics: from fluid dynamics to multiphysics problems.
2021
150
Big data management in the mining industry
2020
149
The state of the art and taxonomy of big data analytics: view from new big data framework
2019
149
Multi-sensor cloud and cloud shadow segmentation with a convolutional neural network
2019
143
An efficient Swarm-Intelligence approach for task scheduling in cloud-based internet of things applications
2018
139
CCS - Rendered Insecure: <span class=\highlight\">GPU</span> Side Channel Attacks are Practical"
2018
127
The Geodesist’s Handbook 2016
2016
124
A case study of conditional deep convolutional generative adversarial networks in machine fault diagnosis
2020
121
A survey on particle swarm optimization with emphasis on engineering and network applications
2019
118
Time series joins, motifs, discords and shapelets: a unifying view that exploits the matrix profile
2017
96
Neuroinspired unsupervised learning and pruning with subquantum CBRAM arrays
2018
90
High-performance computing: the essential tool and the essential challenge
2017
87
Deep reinforcement learning in fluid mechanics: A promising method for both active flow control and shape optimization
2020
83
Evaluation and Mitigation of Radiation-Induced Soft Errors in Graphics Processing Units
2016
82
BOINC: A Platform for Volunteer Computing
2019
80
Using parallel & distributed computing for real-time solving of vehicle routing problems with stochastic demands
2011
78
EuroSys - Balancing efficiency and fairness in heterogeneous <span class=\highlight\">GPU</span> clusters for deep learning"
2020
77
图,在GPU与数据中心研究领域被引用次数最多的研究论文
GPU与数据中心技术涉及到的关键研究领域
在GPU与数据中心技术涉及到的关键研究领域除了计算机科学外还有操作系统,云计算,分布式计算,AI以及并行计算等研究课题;
涉及到的关键研究领域
论文数量
Computer science
计算机科学
1041
Operating system
操作系统
326
Cloud computing
云计算
277
Distributed computing
分布式计算
274
Artificial intelligence
人工智能
249
Parallel computing
并行计算
231
Embedded system
嵌入式系统
174
Engineering
工程
145
Data center
数据中心
134
Field-programmable gate array
现场可编程门阵列
129
Mathematics
数学
120
Scalability
可扩展性
113
Computer architecture
计算机架构
111
Efficient energy use
高效能源利用
111
Computer network
计算机网络
108
Server
服务器
104
Physics
物理
103
Machine learning
机器学习
91
Energy consumption
能源消耗
88
Software
软件
88
Algorithm
算法
77
CUDA
CUDA
77
Scheduling (computing)
调度(计算)
77
Deep learning
深度学习
75
Telecommunications
电信
72
Biology
生物学
70
Supercomputer
超级计算机
70
Electrical engineering
电气工程
69
Artificial neural network
人工神经网络
67
Big data
大数据
66
图,GPU与数据中心涉及到的关键研究领域
相关标签: