智算中心融合算力调度
智猩猩智算集群公开课 2024/10/29 19:30:00
课程讲师
黄朝波
矩向科技 创始人兼CEO
芯片及互联网行业15年以上工作经验,拥有10项授权发明专利;《软硬件融合》图书及公众号作者,软硬件融合相关理念的倡导者和践行者,致力于相关技术的交流传播及技术创新;中国计算机学会高级会员,中移联元宇宙产业委员会常务委员;UCloud硬件及芯片研发负责人,物联网及边缘计算创业经历,Marvell负责高性能CPU多核设计,Simplight自主CPU及4G SOC芯片设计;研究生毕业于国防科技大学计算机学院,本科毕业于西北工业大学。
课程提纲
- 算力供大于求形势下,智算中心未来该如何发展
- 大模型时代,智算成本的优化方法
- 智算中心算力芯片的多元化实现与挑战
- NVIDIA GPU和国产算力芯片的混合调度
课程简介
算力调度是指在计算机集群、数据中心或云计算环境中,对计算资源进行分配和管理的过程。
大模型时代,动辄千亿甚至上万亿的参数规模,使得模型训练和推理需要大量的算力资源,且不同阶段对算力的需求也是动态变化的。算力调度系统可以根据大模型运行特点,合理分配和调整算力资源,避免不同计算节点的算力闲置或过载。此外,算力调度系统还会结合任务的计算特点和CPU、GPU、TPU等不同处理器的特性,将不同的计算任务分配到最合适的硬件上执行,以充分发挥智算中心多样性算力的优势,提高计算效率和资源利用率。
10月29日19:30,「智猩猩智算集群公开课」第2期将开讲,由矩向科技CEO 、《软硬件融合》图书和公众号作者黄朝波主讲,主题为《智算中心融合算力调度》。
本次公开课,黄朝波老师会从智算中心未来发展方向、智算成本的优化方法、算力芯片的多元化实现与挑战,以及NVIDIA GPU和国产算力芯片的混合调度等方面,对智算中心融合算力调度进行系统讲解。
精彩问答
提问
提问