我在用GPU做CFD的时候发现,同样的结构网格(比如把一块结构网格剖分成很多块),网格分区增加时,GPU加速迅速降低——这个可能是多种因素的结果,但其中是否意味着kernel的调度开销其实也挺大?
登录查看完整答案
NVIDIA中国区工程及解决方案总监赖俊杰:
从描述上来说,看起来用到的kernel数目并不多,到现在为止,只在一些网络甚至神经网络相关的一些博客里面看到有大量的小的up操作,当kernel数目调度非常大时,k...
问题来源:面向HPC及AI的巨大飞跃,NVIDIA全新Ampere GPU架构深度解析
其他回答
网友答案仅供其表达个人看法,并不表明智猩猩立场。