图片 2

腾讯云全球首发NVIDIA vComputeServer vGPU实例

阿里云智能异构计算产品专家张新涛表示,“随着轻量级GPU异构计算产品的推出,阿里云实现了GPU的异构计算场景全覆盖,可以为用户提供从从轻量到高性能计算的服务。”

图片 1

当地时间3月18日,在硅谷举办的2019年NVIDIA
GPU技术大会上,阿里云发布了国内首个公共云上的轻量级GPU异构计算产品——VGN5i实例,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本、更高弹性开展业务。

多重特性,广泛适用不同AI场景

图片 2

NVIDIA专业可视化业务副总裁Bob
Pette表示:“企业正在迅速实施人工智能策略,AI策略需要依靠现代应用程序才能实现,而现代应用程序则需强大算力的支持。如今,在NVIDIA
vComputeServer的助力之下,腾讯云可以轻松地帮助客户实施并扩展数据分析、机器学习、AI以及企业中的其他工作负载。”

而阿里云本次首家提供云上轻量级GPU实例,意味着用户可以用更细粒度的计算资源开启业务。该产品基于NVIDIA
Tesla P4
GPU,支持多种规格,企业可以按需选择实例规格或者在云市场选择NVIDIA
Quadro虚拟工作站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。

一直以来,腾讯云都在致力于通过最新虚拟化技术研发为用户提供最安全最便利的异构计算产品。GN7实例具有更出色的性能与安全性,能够安全隔离公有云上的实例。
相比过往进程级别的虚拟化GPU,GN7的升级点在于其提供的设备级虚拟化vGPU是完全模拟出来一个GPU设备,在支持GPU硬件的绝大多数特性的同时,还能够做到操作系统级别的隔离,而且不同的用户使用也不用担心资源争抢的问题。

该产品由阿里云与NVIDIA合作研发,集成了阿里云智能资源调度技术,用户可以按需选择适量的计算资源;同时,还采用了安全隔离技术,实现不同用户之间的强隔离,有效防止信息泄漏;除此之外,QoS控制技术保障了每个用户的GPU资源不被其他租户抢占。

更出色的安全性

以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算;人工智能领域也存在类似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,轻量级计算异构产品可以提升系统灵活性,并大幅降低成本。

基于多精度支持,NVIDIA
T4拥有可加速深度学习训练和推理、机器学习以及数据科学工作负载的 Tensor
Core,以及丰富的平台堆栈,包括用于深度学习的cuDNN、用于数据分析和机器学习的NVIDIARAPIDS、用于云工作站图形的NVIDIAQuadro虚拟工作站和用于云游戏的NVIDIA游戏软件。结合用于GPU虚拟化的
vComputeServer软件,腾讯云客户可以灵活选择在虚拟环境中运行GPU加速的工作负载,从而在提高安全性和利用率的同时降低成本。

在该实例发布之前,业内均采用以单颗物理GPU为单位的云端异构计算服务。然而,在不少使用异构计算服务的场景中,“计算资源过剩”问题也尤为明显。

今日,腾讯云正式对外发布基于 NVIDIA T4
的虚拟GPU计算产品GN7实例,这也是全球首家公有云实现了基于NVIDIAT4GPU及NVIDIA
vComputeServer 软件的vGPU实例。