FP32 to FP16 cast是在Tensor Core里做还是CUDA Core里做的?
答主
王梦娣
阿里巴巴阿里巴巴高级算法工程师
NVIDIA系统架构师齐家兴: ...
问题来源:PAI自动混合精度训练的实现与应用
其他回答
发布
网友答案仅供其表达个人看法,并不表明智猩猩立场。