GTC开发者大会于4月12日晚11:30开始,中国专场于4月13日北京时间上午9:00开始。虽然开发者大会和桌面级显卡并无关系,但我们也能从中了解到许多平时难以望其项背的行业尖端信息。本次开发者大会的主题并不是CPU也并不是显卡,而是“iamai”。
iamai
时至今日NVIDIA究竟是一家什么样的公司,芯片生产厂商?软件平台公司?还是人工智能计算领域的先驱者。就像马斯克正在发射火箭、研究脑机接口;而NVIDIA正在部署各领域的AI计算产品,正如老黄的思路一样:在新技术思维模式下,汽车不再只是一种可销售的产品,而是是百万计或上亿计的可安装软件的基础平台。
01进军CPU领域的决心:Grace
NVIDIA创始人兼首席执行官黄仁勋(记住这个厨房结尾有彩蛋)
还是熟悉的厨房,还是熟悉的皮衣,但再往上看,黄仁勋先生这一头长发,确实更像为AI而疯狂的科学家。首先我们来看所有媒体都在讨论的NVIDIA推出CPU的事。
GraceHopper
在GTC技术大会中黄仁勋发布了NVIDIA首款数据中心CPU——Grace。这是以计算机科学家、美国海军少将GraceHopper的名字命名,而她正是在上世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。
Grace是一款高度专业化的处理器,它使用了高效节能的Arm内核,为训练巨型人工智能模型的系统提供10倍的性能飞跃,主要面向大型数据密集型HPC和AI应用。新一代自然语言处理(NLP)模型的训练会有超过一万亿的参数。
GraceCPU
Grace能够满足世界上最先进应用的计算需求,包括自然语言处理、推荐系统和人工智能超级计算,这些应用分析需要超快计算性能和大容量内存中的巨大数据集。
基于Grace的系统与NVIDIAGPU紧密结合,性能将比目前最先进的NVIDIADGX系统(在x86CPU上运行)高出10倍。它基本性能采用第四代NVIDIANVLink互连技术,该技术在CPU和GPU图形处理单元之间提供GB/s的连接速度,从CPU到CPU的速度超过GB/s,使总带宽比目前领先的服务器高出30倍。黄仁勋表示,这也是世界上第一个为TB级别计算设计的CPU。
应用客户
作为首批客户,瑞士国家超级计算中心(CSCS)将构建一台名为Alps的超级计算机,这台计算机将使用Grace和NVIDIA下一代GPU。美国能源部下属的洛斯阿拉莫斯国家实验室也将在年推出一台基于Grace的超级计算机。
Grace的推出预示着NVIDIA在CPU领域的决心,同时也将抢占Intel最赚钱的这一市场领域。
02NVIDIABlueField-3DPU数据处理器
黄仁勋宣布NVIDIABlueField-3DPU将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。
这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。
BlueField-3
黄仁勋介绍道,而BlueField-3对比BlueField-2实现了10倍的性能飞跃,BlueField-3内置亿个晶体管,首款Gb/s的网络芯片,16个ArmCPU芯片,并且提升了安全等级,对网络流量进行保护、卸载和加速。
BlueField-4已经列上日程了
以2年一迭代的频率,年的BlueField-4则会实现Gb/s的网络速率,相比BlueField-3性能再次提升10倍。3年内(BlueField-2目前刚刚使用)性能提升倍,而这在老黄口中,只是顺应市场需求。
.2EB/s总带宽的NVIDIADGX
DGX是NVIDIA推出的面向AI而生的计算机,黄仁勋宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”——NVIDIADGXStation,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIADGXSuperPod。
NVIDIADGXStation
全新DGXStationG借助GB超快速HBM2e连接至4个NVIDIAAGPU,内存带宽达到每秒8TB,以目前来看,若要实现如此高的显存带宽,至少需要40台CPU服务器。然而最令人惊讶的是,这台便携式的DGXStation可以像普通计算机一样,插入普通的壁装电源插座即可使用,功耗仅W,采用液冷散热,运行声音为37db。
目前,达到这种性能的CPU集群成本约为万美元,而DGXStation仅需14.9万(看到这里我飘了,竟然觉得还挺便宜)美元。
新款的DGXSuperPOD目前是世界上首台原生超级计算机,使用全新80GBNVIDIAA,将其HBM2e内存提升至90TB,实现2.2EB/s的总带宽。同理,若要实现如此高的带宽,需要10台CPU服务器,相当于个机柜数据中心,比DGXSuperPOD多15倍。
DGXSuperPOD(左)、DGXA(中)、DGXStationA(右)
目前它已经升级至采用NVIDIABlueField-2,如此性能的计算机已经是绝大多数个人和公司承担不起的费用了,DGXSuperPOD支持多租户共享,并可实现完全隔离和裸机性能。且NVIDIA如今还为该产品提供配套的NVIDIABaseCommandDGX管理和编排工具。
当然DGXSuperPOD依然可以单独售卖,它的起步价格为万美元,0万美元可扩展至完整系统。
04强大的数据推理NVIDIAMegatron
随后黄仁勋还发布了用于训练Transformers的超大语言模型的NVIDIAMegatronTriton推理服务器。Transformers已帮助开发者在自然语言处理领域取得了突破性进展,能够生成文档摘要、将电子邮件中的短语补充完整、甚至让AI根据用户的期望自己编写代码。
NVIDIAMegatronTriton是超大型语言模型训练与推理服务器,庞大的Transformer模型推理是重大的计算机科学挑战,传统双CPU服务器需要花费1分钟才能响应1项查询。
NVIDIAMegatron
而Megatron能够训练Transformer模型,可对模型进行划分和匹配,实现GPU和多节点推理并行,MegatronTritonInferenceServer通过分布式计算,使使用MegatronTriton的DGX,能在1秒内实现16项查询。
超级计算机的作用除了我们日常看到想到的领域,在很多需要大量推演的领域都有卓越的表现,如量子计算、医疗制药等,新药的研发往往需要耗时10年以上,而失败率高达90%。NVIDIADGXSuperPOD可利用深度学习,大幅提高药物研发速度。
05NVIDIAAI布局
“AI”我们听起来遥远,但却时刻发生在我们身边。黄仁勋表示,AI是当代最强大的技术力量,并认为AI的发展浪潮会有四轮。
第一轮为重塑计算机用于开发软件的新方式,这是我们所有人切身参与的第一轮革新,迄今已有近10年的历史。
第二轮,也就是第一批AI技术采用者大都来自互联网公司,他们拥有出色的计算机科学家、大型计算基础设施,以及收集大量训练数据的能力。
第三轮将会是企业和产业边缘计算,AI可以彻底改变全球大型企业,包括制造业、物流业、农业、医疗健康、金融服务以及运输业。而完整的产业链要实现AI,5G将是解决连接问题的关键。
第四轮则是自动驾驶系统,这里的AI自动驾驶不仅仅是自动驾驶汽车,它只是一个目前实现AI非常好的例子,而最终形态黄仁勋表示,所有能移动的系统最终都将实现自主化。
AI这个曾经只在电影中出现的名词,如今正潜移默化的改变着我们的生活。黄仁勋说到,我们必须让AI更方便更易用,将AI从计算机科学领域的名词转化为计算机产品。
NVIDIAAI领域
从目前来看,NVIDIA已经创建了TensorCoreGPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPUDirext、DOCA等众多技术,所有的这些底层技术,统称为NVIDIAAI。而NVIDIAAI已集成到所有业内流行的工具和工作流程中,并且可在搭载NVIDIAGPU的任何系统上运行,包括PC、笔记本电脑、工作站、超级计算机、云平台等。现在缺少的就是5G技术的连接,我们日常所使用的消费级5G技术只是锦上添花,专用5G技术将为AI技术带来革命性的变化。
06构建强大虚拟世界NVIDIAOmniverse
人类与AI和机器人共存的虚拟实时3D世界不再只是科幻小说中的故事情节。
黄仁勋解释说,NVIDIAOmniverse是一个云原生平台,其特点包括:可以扩展至多个GPU、具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIAMDL模拟材料、可以使用NVIDIAPhysX模拟物理学并且与NVIDIAAI完全集成。
他还表示:“Omniverse旨在创建共享虚拟3D世界,就像尼尔·斯蒂芬森在年代早期的小说《雪崩》中所描述的科幻虚拟空间那样。”
BMWAI工厂
随后为了展示Omniverse的应用领域,黄仁勋与BMW共同展示了一套逼真的AI工厂,Nedeljkovi表示:“这些创新将帮助我们缩短规划时间、提高灵活性和精度,最终使规划效率提高30%。
07NVIDIAJarvis运用AI的语音翻译有何不同
NVIDIAJarvis是一款先进的对话式AI,它可以被定制,并应用于任何领域,用于语音识别、语言、理解、翻译的深度学习的AI。
NVIDIAJarvis
Jarvis可在约毫秒内进行交互,聆听、理解和相应。NVIDIA目前已经对Jarvis使用数百万GPU小时、超10亿页文本,以及6万小时的不同语言、口音、环境和术语的语音对Jarvis进行了训练。根据NVIDIA的说法,目前这款产品可达到90%的识别精度。
目前Jarvis支持5种语言:英语、日语、西班牙语、德语、法语和俄语,未来将会有更多语言加入其中,这使得国际会议将会变得更轻松。
专业术语的翻译
语气调节
同时Jarvis还可以针对特定领域术语进行定制训练,如针对科技和医疗场景,在现场黄仁勋还为我们演示了一段语音翻译,即便他自己并不理解自己说的是什么意思,但Jarvis完全识别出来。不同于其他翻译软件,Jarvis还能根据用户需求来调节朗读的语气,做到真正如AI交互一样。
08NVIDIAMaxine可纠正目光接触的会议软件
NVIDIAMaxine同样是一套AI技术软件,它可以大幅改善视频会议体验,在与NVIDIAJarvis结合使用时,可以实现非常准确的语音转文字。
右侧自动将目光调整为直视镜头
Maxine内置目光接触功能,很多时候我们在视频会议中眼神并没有看向摄像头,而打开这一功能Maxine会自动纠正与会人的注视位置。
AI面部解码器开
AI面部解码器关
在视频会议中最常见的问题就是带宽不足时,视频质量会严重下降,而Maxine可以通过AI面部解码器,有效改善视频质量。
09NVIDIADRIVE集AI之大成者
自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,同时也是最棘手、影响最大的挑战之一。”
黄仁勋表示,将于年投产的NVIDIA自动驾驶汽车计算系统级芯片——NVIDIADRIVEOrin,它也是今后汽车的中央电脑。
NVIDIADRIVEOrin
Orin将处理集群、信息娱乐、乘客交互AI,以及非常重要的信息视图或感知世界模型。信息视图是汽车对周围环境的实际感知,并将其构建成一个3D环绕模型,而黄仁勋也大胆预测通过AI计算,最终后视镜将被环绕3D感知所取代。
随后黄仁勋还宣布推出NVIDIA第8代Hyperion汽车平台,该平台包括参考传感器、AV和中央计算机、3D真值、数据记录器、网络和一些必备软件。
Hyperion8场景模拟
与此同时,NVIDIA新一代车载系统级芯片NVIDIADRIVEAtlan也一同被推出,它可以为汽车带来真正的数据中心。
NVIDIADRIVEAtlan
DRIVEAtlan可以达到每秒超过0万亿次(TOPS)运算次数,致力于应用到年的车型。
简单来说Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术于一体,堪称一项技术奇迹。
10结语:NVIDIA只是一个工具
纵观此次GTC大会,我们见到了NVIDIA对于AI领域的全线布局,我们发现不管是软件上的Omniverse、Maxine、Jarvis还是Megatron、DGX、Grace、BlueField等,都是为了NVIDIAAI生态而构建。
单独看他们只是作为NVIDIA产品中的一环或者是底层技术,但黄仁勋在GTC上的演讲后我们会发现它们将服务于今后的NVIDIAAI网络,对于AI的投资和布局我们很难在一代产品中看出多大效果,往往需要几代产品的规划。
正如DRIVEAtlan一样,它集众多AI技术于一身,相互脱离但又结合紧密,NVIDIA也正将AI从计算机科学领域的名词转化为计算机产品。
回顾本次大会内容
至于大家都很关心的CPU,我们可以大胆预测一下,虽然目前Grace仅用于专业计算领域,但它采用了更高效节能的Arm内核,与苹果的M1芯片相同。Arm是32位精简指令集(RISC)处理器架构,单从性能来讲,x86结构的电脑无论如何都比ARM结构的系统在性能方面要快得多、强得多。
但Arm的优势不在于性能强大而在于效率,Arm采用RISC流水线指令集,在完成综合性工作方面根本就处于劣势,而在一些任务相对固定的应用场合其优势就能发挥得淋漓尽致。
目前Arm系统几乎都采用Linux的操作系统,而且几乎所有的硬件系统都要单独构建自己的系统,与其他系统不能兼容,这也导致其应用软件不能方便移植,这一点一直严重制约了Arm系统的发展和应用。
一转身厨房全部由虚拟场景合成
Grace的推出在训练巨型人工智能模型的系统上,提供了10倍的性能飞跃。而在NVIDIAMegatron的推理和训练下,并借助DGX和BlueField的帮助,Arm生态几乎唾手可得,所以消费级CPU的出现似乎只是时间问题。
最后,对于NVIDIAAI生态,我们套用黄仁勋最后的演讲,“20年前,这一切仿佛科幻小说;10年前,这是个梦想;今天,我们正在实现这个梦想”。归根结底,NVIDIA只是一个工具,一个助力您成就毕生事业的工具。
()
转载请注明:http://www.0431gb208.com/sjszlff/3997.html