CUDA的stream使得GPU计算具有粗粒度并行能力,那么,一般单卡使用多少stream比较合适?即:GPU卡的物理任务管理队列数量是多少?
答主
赖俊杰
NVIDIA中国区工程及解决方案总监
NVIDIA中国区工程及解决方案总监赖俊杰: 单卡用多少stream没有一个特...
问题来源:面向HPC及AI的巨大飞跃,NVIDIA全新Ampere GPU架构深度解析
其他回答
发布
网友答案仅供其表达个人看法,并不表明智猩猩立场。