人工智能变革已到来，英伟达在GTC大会震撼发布世上最强大AI芯片Blackwell

省钱君 1391 浏览 2024-03-20 发布

就在3月18号，GTC大会正式召开了，英伟达ceo也在发布会上发布了多项内容。主要赋能新兴行业：数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成式AI等领域。就连黄仁勋自己都调侃“展示了全球100万亿美元的行业研究成果”，话不多说，快和君君看一下令人震惊的发布内容有哪些吧！

最强大的AI芯片——Blackwell

图片来自于NVIDIA，版权属于原作者

NVIDIA 正式宣布推出 NVIDIA Blackwell芯片，提供超强的算力，使世界各地的组织能够在万亿参数大型语言模型上构建和运行实时生成式 AI。据称，Blackwell运行AI模型的能力比它的前身Hopper强30倍。每台成本将在 30,000 至 40,000 美元之间。

图片来自于NVIDIA，版权属于原作者

Blackwell 的名字来源于一位数学家、博弈论、概率论专家——David Blackwell，该芯片使用的六项革命性技术共同支持高达 10 万亿参数的模型的 AI 训练和实时 LLM 推理，包括：

世界上最强大的芯片 —— Blackwell 包含 2080 亿个晶体管，采用定制的 4NP TSMC 工艺制造，具有两个十字线极限 GPU 芯片，通过 10 TB/秒的芯片到芯片链路连接成单个统一的 GPU 。
第二代 Transformer 引擎 —— 在新的微张量缩放支持和集成到 NVIDIA 先进动态范围管理算法的推动下，Blackwell 将通过新的 4 位浮点 AI 支持双倍的计算和模型大小推理能力。
第五代 NVLink ——为数万亿参数和混合专家 AI 模型提供了突破性的性能加速，每个 GPU 的双向吞吐量高达 1.8TB/s，确保了多达 576 个 GPU 之间的无缝高速通信。
RAS 引擎 —— Blackwell 通过专用的可靠性、可用性和可维护性 (RAS) 引擎增加了智能弹性，通过智能弹性最大限度地减少停机时间，人工智能识别潜在故障，并预测和拦截停机和低效率的根源，从而节省时间、能源和计算成本。
安全人工智能 ——可在不影响性能的情况下保护人工智能模型和客户数据，并支持新的本机接口加密协议，保护了医疗保健和金融服务等隐私敏感行业的安全需求。
解压缩引擎——专用解压缩引擎支持最新压缩格式，通过高速链路访问NVIDIA Grace CPU中大量内存（每秒 900 GB 的双向带宽），提供了数据分析和数据科学的最高性能。

图片来自于NVIDIA ，版权属于原作者

基于该芯片架构的是B200和GB200系列两款大模型训练芯片，B200拥有2080亿个晶体管，采用台积电4NP工艺制程， 支持多达10万亿个参数的AI大模型训练。

GB200玩的是最优组合，将两个B200 Blackwell GPU与一个基于Arm的Grace CPU进行集成拼合，全场景支持业内AI大模型的基础建设支撑。

NVIDIA Omniverse Cloud

NVIDIA Omniverse Cloud 是英伟达即将推出的“计算平台” ，同时也是一个由图形就绪数据中心组成的全球网络。可以帮助个人和团队开发3D工作流程及应用。将被引入到Apple最近发布的Vision Pro等混合现实设备。

图片来自于NVIDIA ，版权属于原作者

五个新的 Omniverse Cloud API 程序可以单独或一起使用，包括：

USD 渲染 — 生成 OpenUSD 数据的完全光线追踪 NVIDIA RTX™ 渲染。
USD 写入 — 允许用户修改 OpenUSD 数据并与之交互。
USD查询 ——实现场景查询和场景交互。
USD通知 — 跟踪USD变化并提供更新。
Omniverse Channel — 连接用户、工具和世界，实现跨场景协作。

在演示中，NVIDIA 展示了一款交互式、物理精确的汽车数字模型，完全保真地传输到 Apple Vision Pro 的高分辨率显示屏上。

在演示中，设计师佩戴 Vision Pro，使用由 CGI 工作室Katana在 Omniverse 平台上开发的汽车配置器应用程序。设计师切换油漆和装饰选项，甚至进入车辆 - 通过将 3D 逼真环境与物理世界融合，使用空间计算。

6G研究云平台

NVIDIA 还在GTC大会上宣布推出一个 6G 研究平台，为研究人员提供了一套全面的套件，以推进无线电接入网络 (RAN) 技术的人工智能。该平台使组织能够加速 6G 技术的开发，将数万亿设备与云基础设施连接起来，为由自动驾驶汽车、智能空间以及广泛的扩展现实和沉浸式教育体验支持的超智能世界奠定基础。

图片来自于NVIDIA，版权属于原作者

NVIDIA 6G 研究云平台由三个基本元素组成：

适用于 6G 的 NVIDIA Aerial Omniverse Digital Twin：参考应用程序和开发人员示例，可对从单塔到城市规模的完整 6G 系统进行物理精确模拟。结合软件定义的 RAN 和用户设备模拟器，以及真实的地形和对象属性。研究人员将能够基于特定站点的数据模拟和构建基站算法，并实时训练模型以提高传输效率。
NVIDIA Aerial CUDA-Accelerated RAN：软件定义的全 RAN 堆栈，为研究人员实时定制、编程和测试 6G 网络提供了极大的灵活性。
NVIDIA Sionna 神经无线电框架：该框架可与 PyTorch 和 TensorFlow 等流行框架无缝集成，利用 NVIDIA GPU 生成和捕获数据并大规模训练 AI 和机器学习模型。这是用于基于 AI/ML 的无线模拟的领先链路级研究工具。