就在3月18号,GTC大会正式召开了,英伟达ceo也在发布会上发布了多项内容。主要赋能新兴行业:数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成式AI等领域。就连黄仁勋自己都调侃“展示了全球100万亿美元的行业研究成果”,话不多说,快和君君看一下令人震惊的发布内容有哪些吧!
最强大的AI芯片——Blackwell
NVIDIA 正式宣布推出 NVIDIA Blackwell芯片,提供超强的算力,使世界各地的组织能够在万亿参数大型语言模型上构建和运行实时生成式 AI。据称,Blackwell运行AI模型的能力比它的前身Hopper强30倍。每台成本将在 30,000 至 40,000 美元之间。
Blackwell 的名字来源于一位数学家、博弈论、概率论专家——David Blackwell,该芯片使用的六项革命性技术共同支持高达 10 万亿参数的模型的 AI 训练和实时 LLM 推理,包括:
- 世界上最强大的芯片 —— Blackwell 包含 2080 亿个晶体管,采用定制的 4NP TSMC 工艺制造,具有两个十字线极限 GPU 芯片,通过 10 TB/秒的芯片到芯片链路连接成单个统一的 GPU 。
- 第二代 Transformer 引擎 —— 在新的微张量缩放支持和集成到 NVIDIA 先进动态范围管理算法的推动下,Blackwell 将通过新的 4 位浮点 AI 支持双倍的计算和模型大小推理能力。
- 第五代 NVLink ——为数万亿参数和混合专家 AI 模型提供了突破性的性能加速,每个 GPU 的双向吞吐量高达 1.8TB/s,确保了多达 576 个 GPU 之间的无缝高速通信。
- RAS 引擎 —— Blackwell 通过专用的可靠性、可用性和可维护性 (RAS) 引擎增加了智能弹性,通过智能弹性最大限度地减少停机时间,人工智能识别潜在故障,并预测和拦截停机和低效率的根源,从而节省时间、能源和计算成本。
- 安全人工智能 ——可在不影响性能的情况下保护人工智能模型和客户数据,并支持新的本机接口加密协议,保护了医疗保健和金融服务等隐私敏感行业的安全需求。
- 解压缩引擎——专用解压缩引擎支持最新压缩格式,通过高速链路访问NVIDIA Grace CPU中大量内存(每秒 900 GB 的双向带宽),提供了数据分析和数据科学的最高性能。
基于该芯片架构的是B200和GB200系列两款大模型训练芯片,B200拥有2080亿个晶体管,采用台积电4NP工艺制程, 支持多达10万亿个参数的AI大模型训练。
GB200玩的是最优组合,将两个B200 Blackwell GPU与一个基于Arm的Grace CPU进行集成拼合,全场景支持业内AI大模型的基础建设支撑。
NVIDIA Omniverse Cloud
NVIDIA Omniverse Cloud 是英伟达即将推出的“计算平台” , 同时也是一个由图形就绪数据中心组成的全球网络。可以帮助个人和团队开发3D工作流程及应用。将被引入到Apple最近发布的Vision Pro等混合现实设备。
五个新的 Omniverse Cloud API 程序可以单独或一起使用,包括:
- USD 渲染 — 生成 OpenUSD 数据的完全光线追踪 NVIDIA RTX™ 渲染。
- USD 写入 — 允许用户修改 OpenUSD 数据并与之交互。
- USD查询 ——实现场景查询和场景交互。
- USD通知 — 跟踪USD变化并提供更新。
- Omniverse Channel — 连接用户、工具和世界,实现跨场景协作。
在演示中,NVIDIA 展示了一款交互式、物理精确的汽车数字模型,完全保真地传输到 Apple Vision Pro 的高分辨率显示屏上。
在演示中,设计师佩戴 Vision Pro,使用由 CGI 工作室Katana在 Omniverse 平台上开发的汽车配置器应用程序。设计师切换油漆和装饰选项,甚至进入车辆 - 通过将 3D 逼真环境与物理世界融合,使用空间计算。
6G研究云平台
NVIDIA 还在GTC大会上宣布推出一个 6G 研究平台,为研究人员提供了一套全面的套件,以推进无线电接入网络 (RAN) 技术的人工智能。该平台使组织能够加速 6G 技术的开发,将数万亿设备与云基础设施连接起来,为由自动驾驶汽车、智能空间以及广泛的扩展现实和沉浸式教育体验支持的超智能世界奠定基础。
NVIDIA 6G 研究云平台由三个基本元素组成:
- 适用于 6G 的 NVIDIA Aerial Omniverse Digital Twin:参考应用程序和开发人员示例,可对从单塔到城市规模的完整 6G 系统进行物理精确模拟。结合软件定义的 RAN 和用户设备模拟器,以及真实的地形和对象属性。研究人员将能够基于特定站点的数据模拟和构建基站算法,并实时训练模型以提高传输效率。
- NVIDIA Aerial CUDA-Accelerated RAN:软件定义的全 RAN 堆栈,为研究人员实时定制、编程和测试 6G 网络提供了极大的灵活性。
- NVIDIA Sionna 神经无线电框架:该框架可与 PyTorch 和 TensorFlow 等流行框架无缝集成,利用 NVIDIA GPU 生成和捕获数据并大规模训练 AI 和机器学习模型。这是用于基于 AI/ML 的无线模拟的领先链路级研究工具。
Project GR00T
GR00T项目是一个为类人机器人建立的通用基础模型,旨在进一步推动机器人技术和具体人工智能领域的突破。作为该项目的一部分,英伟达还推出了为类人机器人设计的新计算机"Jetson Thor"。黄仁勋还说这将 是人工智能和机器人技术的“下一波浪潮”。
GR00T代表通用机器人00技术,由GR00T驱动的机器人将被设计为通过观察人类行为来理解自然语言和模仿动作——快速学习协调性、灵活性和其他技能,以便导航、适应现实世界并与现实世界互动。
GR00T 使用的 Isaac 工具能够为任何环境中的任何机器人实例创建新的基础模型。这些工具包括用于强化学习的Isaac Lab和计算编排服务OSMO ,新的 Isaac 平台功能预计将在下个季度推出。
AI的发展进程已经彻底打破摩尔定律,开启了全新的AI变革,所以老黄在面对自己的前代产品Grace架构的H100时,也只能略带调侃的说“It's OK,Grace”。那么大家怎么看待老黄这次的发布会呢?欢迎在评论区讨论~
【封面图:CNBC】