英伟达：除了H100外，中国企业可以购买新架构RTX 40系显卡及新款AI芯片｜硅基世界

语言: CN / TW / HK

时间 2022-09-21 13:45:00 钛媒体

英伟达Ada Lovelace架构GPU图形处理器（来源：英伟达官网）

钛媒体App 9月21日消息，美国芯片巨头英伟达（NVIDIA）日前举行一年一度的GTC 2022 大会。

昨晚（20日）GeForce Beyond主题演讲上，英伟达CEO黄仁勋 (Jensen Huang) 宣布，公司正式推出基于5nm（TSMC N4）制程的全新Ada Lovelace架构多款旗舰产品，其中包括具有760亿个晶体管、搭载新一代DLSS 3图像缩放技术的RTX 4090 GPU（图形处理器）消费级旗舰显卡，次旗舰RTX 4080以及L40 OVX元宇宙数据计算系统。

同时，英伟达还推出Grace CPU 超级芯片、算力2000TFLOPS的Drive Thor（雷神索尔）自动驾驶芯片、用于下一代机器人的Jetson Orin芯片等多款 AI 芯片，以及元宇宙产品线 Omniverse 的最新进展和生态合作信息。在会上，黄仁勋还披露，H100已经全面投产。

不过，钛媒体App注意到，大会演讲中，英伟达于2022年10月发货的H100 Tensor Core GPU首批8个合作伙伴，除了联想外没有其他中国企业。同时，Ada Lovelace架构企业级产品和Grace CPU超级芯片首批合作客户中没有阿里、腾讯、百度等中国公司身影。此前的9月1日，英伟达发布更新监管文件，称其高性能GPU的出口已得到美国政府部分许可。

那么这是否意味着，中国公司无法采购英伟达最新的H100 GPU芯片以及Ada Lovelace架构的多款芯片产品？

对此，英伟达公司负责人对钛媒体App独家回应称：根据美国政府最近宣布的规定，未经许可，我们不能出口、转让或移动NVIDIA H100 GPU 或包含它们的主板/系统以在中国市场上使用。但此限制不适用于Grace CPU超级芯片，或基于Ada Lovelace的RTX 4090、4080或L40等主题演讲中提到的其他产品。此外，英伟达Jetson Orin芯片也可以在包括中国大陆在内的全球范围内使用。

但英伟达没有对钛媒体App回应，一旦美国政府出台新的限制规定下，Ada Lovelace架构产品是否会影响中国大陆企业。

据悉，20日演讲中，黄仁勋展示了英伟达RTX、AI 芯片和元宇宙产品线Omniverse 的最新进展，还包括它们对AI 药物领域新突破的帮助，以及大量应用落地。

第三代RTX显卡方面，英伟达最新推出的GeForce RTX 40系列显卡，是全球首款采用全新NVIDIA Ada Lovelace架构的GPU产品。

旗舰版本RTX 4090 GPU显卡最高配备24GB美光科技的板载内存，转投台积电后，内置芯片为TSMC定制的N4制程，塞进了760亿个晶体管，比上一代Ampere多了70%，Ada效能是前代产品（RTX 3090）的四倍。“Ada正在为完全基于仿真的未来游戏铺路。”黄仁勋说。

黄仁勋也重点提到全新一代DLSS 3超采样超分辨率技术——利用卷积自动编码器AI模型，在不影响图像质量的情况下可以提升性能，自动补出高分辨率。英伟达在Ada架构中引入了DLSS 3，开启DLSS时，4080可达到3080Ti的两倍性能，相较于单纯的渲染可以将性能提升多至4倍。

价格上，作为世界上最快的游戏GPU，RTX 4090公版售价1599美元（人民币12999元）起，10月12日开始售卖；RTX 4080价格比前代涨了500美元，16GB售价1199美元（9499元），12GB版售价899美元（7199元），将于11月推出。

公布的供货方，华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将在中国推出GeForce RTX 4090和4080 GPU标频版和超频版。RTX 40系列GPU还会通过宏碁、外星人、华硕、戴尔、惠普、联想、微星等OEM厂商出售。

元宇宙产品方面，英伟达发布专为元宇宙应用打造的第二代OVX计算机，搭载了新Ada Lovelace L40数据中心GPU，以提供实时图形、AI和数字孪生模拟功能。L40 GPU已全面进入量产，第二代OVX系统将于明年年初向市场提供，技嘉、新华三、浪潮、联想、QCT会使用OVX系统，宝马集团和捷豹路虎是首批OVX客户。

除硬件外，英伟达还推出其首款IaaS产品Omniverse Cloud服务，可连接在云、本地或设备上运行的Omniverse应用。个人或团队可以借助该服务一键体验设计和协作3D工作流程的能力，无需任何本地计算能力。

全新 AI 芯片方面，黄仁勋首先修正了公司的汽车SoC路线图，将1000 TOPS专用处理器Atlan升级，计划推出具备2000 TFLOPS性能的自动驾驶芯片Thor（雷神索尔），算力是目前Orin芯片的8倍，吞吐量是Atlan的两倍，交付性能也是Atlan的两倍以上，预计2024年推出，2025年上车使用。

黄仁勋表示，短短一年实现性能提升离不开三个架构因素：Grace、Hopper 和 Ada Lovelace，其中 Grace提供了新的Transformer引擎、ViT的快速变革，而Lovelace有助于车载计算资源的集中化，将成本降低数百美元。

对于Orin产品线，英伟达推出了一款微型机器人计算机Jetson Orin Nano，速度比上一代Jetson Nano快了80倍。黄仁勋提到，自动驾驶汽车的基本处理流水线可应用于各种机器人系统。而第二代机器人处理器DRIVE Orin已经被40多家汽车、卡车、无人驾驶出租车和穿梭巴士的制造公司采用。

黄仁勋指出，NVIDIA平台现已拥有350万名开发者，12000家企业正基于英伟达的产品开展新业务，英伟达通过550个SDK和AI模型为约3000个应用提供加速，合作方包括腾讯云、浪潮、IBM等。“总体来说，我们所服务的各行业总价值约为100万亿美元。”黄仁勋表示。

此外，基于Hopper架构，英伟达今天还推出了Nemo LLM云服务，以及BioNeMo LLM服务，用于低门槛训练大型语言模型以及生物分子语言模型，从而高效执行特定任务。

面向数据中心，英伟达在今年4月发布的包含800亿个晶体管，采用了全新Hopper架构的英伟达H100 Tensor Core GPU已经进入大规模量产，预计下个月起对OEM厂商发货，到今年年底预计将有超过50款服务器型号面市；旗舰DGX H100则于今天起预定，预计在2023年第一季度（即从现在起的4到7个月）交付。

据介绍，H100使企业能够削减AI的部署成本，相较于上一代A100，在提供相同AI性能的情况下，可将能效提高3.5倍，总成本减少至33%，所使用的服务器节点数也减少至20%。

然而，大部分中国企业将不会采购到H100。

黄仁勋此前在此前内部信中提到，英伟达正在与中国客户协商，将寻找最佳替代品以配合他们的需求，或寻求其他技术许可。

但问题是，目前中国客户正在寻求替代的国产芯片产品，尤其是去年全球芯片短缺下，没有办法得到英伟达GPU芯片的中国企业。世界人工智能大会一场论坛圆桌中，有国内芯片企业负责人表示，这一事件让整个产业链里面就紧张起来了，有很多企业创始人直接找到汽车芯片公司商量“国产替代”事宜。

“我们认为美国对高端GPU芯片的禁令将推动GPU芯片的国产替代，”光大证券在一份研报中写道，“从产品性能来看，目前国产高端AI芯片的通用性与英伟达相比仍有一定差距，但在某一些维度已经接近或者超过英伟达。”

“我意识到这种限制是在一个已经充满挑战的环境下出现的。感谢大家尽最大努力遵守新的许可证要求，为我们的客户服务。我有信心我们能渡过难关。”黄仁勋在信中表示。 （本文首发钛媒体App，作者｜林志佳）

「其他文章」