使用T4对这些AI推理模型加速时，对CPU、内存、硬盘和网络带宽有什么依赖要求？

使用T4对这些AI推理模型加速时，对CPU、内存、硬盘和网络带宽有什么依赖要求？

答主

徐添豪

NVIDIA数据科学家

NVIDIA数据科学家徐添豪: 在做模型推理的时候，首先要考虑CPU和GPU的配比，每个场景的配比都不太一样。在短视频的workload整个pipeline里面有解码，如果CPU资源赋有富裕，那这时完全可以在CPU上做解码，然后放到GPU上做推理...

问题来源：短视频场景的AI应用推理与优化

其他回答

发布

网友答案仅供其表达个人看法，并不表明智猩猩立场。

相关回答

每次是重现开始新的训练，模型效果会提升

训练模型的时候，发现多次训练，模型的推理能力会有提升，这是偶然事件吗？

T4 4卡负载率低的问题如何解决？硬件还是软件？

请问MPS在推理中是否有使用价值，刚在您提到相对多流，性能仅有一点点提升。实际场景中，多流并发处理带来的价值是否更大？

多进程使用单张T4推理时，是否可以用MPS提升T4利用率和latency性能？

热门问答

请问INT4的算力为什么是INT8的2倍，而不是4倍？

SR-IOV和MIG的关系是什么？A100是否支持SR-IOV？

请教一下，在A100上MPS技术会怎样演进，和MIG技术有哪些结合？

MIG将来是不是会取代vGPU？有大致路线图吗？适配vGPU和适配MIG有没有升级问题？还是无缝升级？

NVLink与NVSwitch是什么关系？

如果不使用MIG，那么就可以使用8个GPU了？还有结构化稀疏支持两个矩阵都是稀疏的么？

NVLink 3.0通过12个X4 Link来支持双向600GB带宽，平均每个X4 link是50GB，这样的话，X16 link的双向带宽就有200GB，这个带宽已经超过PCIe 5.0的标准了，是这样吗？

MIG的各实例是程序员控制还是系统控制？

纹理内存究竟是单独的内存区域？还是gmem的一种特殊访问方式？（即，有限的究竟是纹理缓存还是纹理内存）

陈博士您好，请问MinD-Vis可以用到3D的图像数据生成上吗？在cross attention上和在time embedding上加的条件分别有什么作用呢？除了在cross attention上和在time embedding上加条件之外，还有什么地方可以加条件呢？