绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
NVIDIA全新AI计算平台及高速网络技术解析
DGX 2020/06/19 19:00:00
课程讲师
路川 NVIDIA 机器学习解决方案架构师

在 NVIDIA 主要负责帮助企业客户构建基于GPU 计算的深度学习系统方案,在机器学习、高性能计算和云计算领域有着丰富的项目经验。曾作为主要技术人员参与国家大型超算项目的规划和建设,熟悉超算系统建设流程、高性能计算网络、并行存储系统等。

路川
NVIDIA 机器学习解决方案架构师

在 NVIDIA 主要负责帮助企业客户构建基于GPU 计算的深度学习系统方案,在机器学习、高性能计算和云计算领域有着丰富的项目经验。曾作为主要技术人员参与国家大型超算项目的规划和建设,熟悉超算系统建设流程、高性能计算网络、并行存储系统等。

冯高锋 NVIDIA 网络事业部HPC-AI技术市场总监

同时担任国际高性能计算和人工智能咨询委员会HPC和AI亚太区首席架构师,负责高性能计算和人工智能行业的高性能网络方案和市场推广,为InfiniBand在超大规模数据中心应用和优化构建方案。冯高锋长期从事高性能计算行业,在高性能计算系统架构,软件优化,网络拓扑设计和优化,路由算法,数据中心虚拟化等有多年积累。

冯高锋
NVIDIA 网络事业部HPC-AI技术市场总监

同时担任国际高性能计算和人工智能咨询委员会HPC和AI亚太区首席架构师,负责高性能计算和人工智能行业的高性能网络方案和市场推广,为InfiniBand在超大规模数据中心应用和优化构建方案。冯高锋长期从事高性能计算行业,在高性能计算系统架构,软件优化,网络拓扑设计和优化,路由算法,数据中心虚拟化等有多年积累。

课程提纲
  • NVIDIA 新一代AI计算平台DGX A100详解
  • 高性能可扩展AI超级计算机DGX SuperPOD架构解析
  • 案例分析:如何使用DGX SuperPOD加速AI训练
  • InfiniBand高速网络技术发展历程
  • DGX SuperPOD系统中的InfiniBand可扩展组网技术
  • 新一代InfiniBand网络技术创新
课程简介

5月26日,腾讯宣布投入5000亿用于新基建,而在数据中心方面,将陆续在全国新建多个百万级服务器规模的大型数据中心;6月6日,快手公司宣布投资100亿元人民币自建数据中心,计划部署30万台服务器,主要用于大数据和AI训练;在6月9日阿里云线上峰会中,阿里云智能总裁张建锋表示,现在阿里云已有100多万台服务器,而三年后这一数据将超过300万台。新基建浪潮正在加速数据中心的建设。

数据中心的构建是一个及其复杂的过程,需要考虑环境温度控制、数据安全、网络传输带宽、资源管理等多种因素。另外,面对不断提升的计算需求,可扩展性也是数据中心建设过程中必须要提前考虑的重要因素。

在GTC 2020发布会上,NVIDIA 展示了新一代 DGX SuperPOD。该集群利用 Mellanox HDR 200Gbps InfiniBand 互连技术,将140台 DGX A100 系统结合在一起,构建了DGX SuperPOD AI超级计算机, AI计算能力高达700 Petaflops,用于公司内部对话式AI、基因组学和自动驾驶等领域的研究。

为帮助客户利用DGX A100系统快速构建自己的数据中心,NVIDIA 发布了全新DGX SuperPOD参考架构,通过该参考架构,企业可以借鉴NVIDIA所采取的设计原则和最佳实践经验,提升数据中心构建效率,大大缩短交付时间。

6月19日,智东西公开课推出数据中心扩展计算公开课 NVIDIA 专场,由 NVIDIA 机器学习解决方案架构师路川、NVIDIA 网络事业部HPC-AI技术市场总监冯高锋共同主讲,主题为《NVIDIA 全新AI计算平台及高速网络技术解析》。

本次专场,路川、冯高锋两位老师将共同为我们揭秘由 140 台 DGX A100 系统和 Mellanox 网络技术搭建的 DGX SuperPOD。同时,这也是NVIDIA收购Mellanox 后首次线上讲解其新一代 InfiniBand 网络技术。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...