问答
文章
下载
问答
登录
登录
短视频推荐算法引擎应用场景中,如何解决多卡负载利用率低的瓶颈?硬件还是软件优化?举例最好
答主
徐添豪
NVIDIA数据科学家
登录查看完整答案
NVIDIA数据科学家徐添豪: 我的理解它是分2块,第一块是在硬件上,就是在CPU和GPU的配比上可以做一些考虑。包括像之前GTC上百度介绍的一些内容,...
问题来源:短视频场景的AI应用推理与优化
其他回答
发布
网友答案仅供其表达个人看法,并不表明智猩猩立场。
相关回答
每次是重现开始新的训练,模型效果会提升
训练模型的时候,发现多次训练,模型的推理能力会有提升,这是偶然事件吗?
T4 4卡负载率低的问题如何解决?硬件还是软件?
请问MPS在推理中是否有使用价值,刚在您提到相对多流,性能仅有一点点提升。实际场景中,多流并发处理带来的价值是否更大?
多进程使用单张T4推理时,是否可以用MPS提升T4利用率和latency性能?
热门问答
请问INT4的算力为什么是INT8的2倍,而不是4倍?
SR-IOV和MIG的关系是什么?A100是否支持SR-IOV?
请教一下,在A100上MPS技术会怎样演进,和MIG技术有哪些结合?
MIG将来是不是会取代vGPU?有大致路线图吗?适配vGPU和适配MIG有没有升级问题?还是无缝升级?
NVLink与NVSwitch是什么关系?
如果不使用MIG,那么就可以使用8个GPU了?还有结构化稀疏支持两个矩阵都是稀疏的么?
MIG的各实例是程序员控制还是系统控制?
NVLink 3.0通过12个X4 Link来支持双向600GB带宽,平均每个X4 link是50GB,这样的话,X16 link的双向带宽就有200GB,这个带宽已经超过PCIe 5.0的标准了,是这样吗?
纹理内存究竟是单独的内存区域?还是gmem的一种特殊访问方式?(即,有限的究竟是纹理缓存还是纹理内存)
NeRF目前非常火爆,最近也有很多工作把NeRF应用到SLAM。相比于传统的SLAM,NeRF-based SLAM的优势在哪?未来的发展方向又是怎样的呢?