随着世界争相利用最新一波人工智能技术,有一种高科技硬件已经成为令人惊讶的热门商品:图形处理单元(GPU)
顶级GPU的售价可达数万美元,随着对其产品的需求激增,领先制造商NVIDIA的市场估值飙升至2万亿美元以上
GPU也不仅仅是高端人工智能产品。手机、笔记本电脑和游戏机中也有功能较弱的GPU
现在你可能在想:什么是GPU,真的吗?是什么让它们如此特别
什么是GPU
GPU最初主要用于快速生成和显示复杂的3D场景和对象,例如视频游戏和计算机辅助设计软件中涉及的场景和对象。现代GPU还处理诸如解压缩视频流之类的任务
大多数计算机的“大脑”是一种称为中央处理器(CPU)的芯片。CPU可以用于生成图形场景和解压缩视频,但与GPU相比,它们在这些任务上通常要慢得多,效率也更低。CPU更适合于一般的计算任务,如文字处理和浏览网页
GPU与CPU有何不同
一个典型的现代CPU由8到16个“核心”组成,每个核心都可以按顺序处理复杂的任务
另一方面,GPU有数千个相对较小的内核,这些内核被设计为同时(“并行”)工作,以实现快速的整体处理。这使得它们非常适合需要大量简单操作的任务,这些操作可以同时完成,而不是一个接一个地完成
传统GPU有两种主要风格
首先,有独立的芯片,这些芯片通常是大型台式电脑的附加卡。其次是在同一芯片封装中与CPU组合的GPU,这种芯片通常出现在笔记本电脑和游戏机(如PlayStation 5)中。在这两种情况下,CPU都控制GPU的操作
为什么GPU对人工智能如此有用
事实证明,GPU的用途不仅仅是生成图形场景
人工智能(AI)背后的许多机器学习技术,如深度神经网络,在很大程度上依赖于各种形式的“矩阵乘法”
这是一种数学运算,将大量的数字相乘并求和在一起。这些操作非常适合并行处理,因此GPU可以非常快速地执行这些操作
GPU的下一步是什么
由于内核数量和运行速度的提高,GPU的数字运算能力正在稳步提高。这些改进主要是由台湾台积电等公司在芯片制造方面的改进推动的
单个晶体管——任何计算机芯片的基本组件——的尺寸正在减小,允许更多的晶体管放置在相同数量的物理空间中
然而,这并不是故事的全部。虽然传统的GPU对人工智能相关的计算任务很有用,但它们并不是最优的
正如GPU最初设计用于通过提供图形的专门处理来加速计算机一样,也有加速器设计用于加速机器学习任务。这些加速器通常被称为“数据中心GPU”。
一些最受欢迎的加速器,由AMD和NVIDIA等公司制造,最初是作为传统GPU。随着时间的推移,他们的设计不断发展,以更好地处理各种机器学习任务,例如通过支持更高效的“大脑浮动”数字格式
其他加速器,如谷歌的张量处理单元和Tenstorrent的Tensix核心,都是从头开始设计的,用于加速深度神经网络
数据中心GPU和其他人工智能加速器通常比传统GPU附加卡具有更多的内存,这对于训练大型人工智能模型至关重要。人工智能模型越大,其能力和准确性就越高。
为了进一步加快训练和处理更大的人工智能模型,如ChatGPT,可以将许多数据中心GPU汇集在一起,形成一台超级计算机。这需要更复杂的软件才能正确利用可用的数字运算能力。另一种方法是创建一个非常大的加速器,例如Cerebras生产的“晶圆级处理器”
专用芯片是未来吗
CPU也没有停滞不前。AMD和英特尔最近的CPU内置了低级指令,可以加速深度神经网络所需的数字运算。这种额外的功能主要有助于“推理”任务,即使用其他地方已经开发的人工智能模型
首先要训练人工智能模型,仍然需要类似GPU的大型加速器
可以为特定的机器学习算法创建越来越专业的加速器。例如,最近,一家名为Groq的公司生产了一种“语言处理单元”(LPU),专门用于按照ChatGPT的思路运行大型语言模型
然而,创建这些专用处理器需要大量的工程资源。历史表明,任何给定的机器学习算法的使用率和受欢迎程度都会达到峰值,然后下降——因此昂贵的专用硬件可能会很快过时
然而,对于普通消费者来说,这不太可能是个问题。你使用的产品中的GPU和其他芯片可能会悄悄地变得更快
想要了解更多关于脑机接口技术的内容,请关注脑机网,我们将定期发布最新的研究成果和应用案例,让您第一时间了解脑机接口技术的最新进展。