【架构】GPU虚拟化

9月前作者：Destiny 分类：Toy博客阅读(37) 违法举报

这篇具有很好参考价值的文章主要介绍了【架构】GPU虚拟化。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

GPU虚拟化方法

【架构】GPU虚拟化,硬件架构,云安全,架构

远程调用API

【架构】GPU虚拟化,硬件架构,云安全,架构

【架构】GPU虚拟化,硬件架构,云安全,架构

半虚拟化和全虚拟化

【架构】GPU虚拟化,硬件架构,云安全,架构

硬件划分

【架构】GPU虚拟化,硬件架构,云安全,架构
局限：授权付费

1. Hardware Partition：Ampere 架构的 A100 GPU 所支持的 MIG，即是一种 Hardware Partition。它的问题是不灵活: 只有高端 GPU 支持；只支持 CUDA 计算；A100 只支持 7 个 MIG 实例。
1. nVidia MPS：它通过将多个进程的 CUDA Context，合并到一个 CUDA Context 中，省去了 Context Switch 的开销，也在 Context 内部实现了算力隔离。导致了额外的故障传播，在工业界和多租户场景不常使用。
1. Time Sharing：不管是哪一代的 GPU，其 Engine 都是支持多任务调度的。一个 OS 中同时运行多个 CUDA 任务，这些任务就是在以 Time Sharing 的方式共享 GPU。鉴于 MIG 的高成本和不灵活、MPS 故障隔离方面的致命缺陷，事实上就只剩下一种可能：Time Sharing。唯一的问题是，如何在原厂不支持的情况下，利用 Time Sharing 支持好算力隔离、以保证 QoS。

挑战和方向

轻量级虚拟化

容器提供了进程级的轻量级虚拟化，不需要额外的包装库，虚拟化能接近原始性能，需要高效的调度配合使用。

可扩展性

虚拟化目的是提高资源利用率和减少使用者的开销，一个物理机器中整合大量VM可以达成目的，但是CPU和GPU大的整合能力不同，需要从GPU设备内存、GPU上下文切换频率和缓存占用等方面研究VGPU数量对性能的影响。

安全性

hypervisor提供安全隔离，防止一个VM映射到其他VM的地址空间；还有拒绝服务攻击，有文章检查可疑VM并kill来解决，这会导致部分正常VM服务暂停；为了避免GPU重置，需要细粒度的访问控制机制，有方法使用远程API调用，vCUDA，VOCL等，但没有实现隔离，存在安全问题。

参考

[1] https://www.zhihu.com/zvideo/1359813304349667328
[2] https://dl.acm.org/doi/pdf/10.1145/3068281文章来源地址https://www.toymoban.com/news/detail-832567.html

到了这里，关于【架构】GPU虚拟化的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

GPU桌面虚拟化HyperV实践

目录创建虚拟机添加GPU 刷入显卡驱动 a说科技：1台电脑当10台用，在家开网吧，显卡分割术，Gpu虚拟化（下） https://www.bilibili.com/video/BV1Dm4y1A7XR/?spm_id_from=333.880.my_history.page.clickvd_source=473f5de900547235e222613fd986ab31 额外补充说明：镜像可用Wintogo快速制作，刷入wintogo EFI到虚拟

2024年02月06日
浏览(42)
汽车虚拟ECU和MCU硬件虚拟化，傻傻分不清楚

目录 1.概述 2.汽车虚拟ECU 3.汽车MCU虚拟化功能 4.小结近几年，随着智能网联汽车普及，车型的更新迭代速度进一步提升，功能开发工程师希望在能够在硬件成型前验证软件功能，意味着汽车控制器的功能开发也在不断左移。为此业内出现了对ECU进行虚拟化以加速开发的呼声

2024年01月25日
浏览(47)
K8S节点GPU虚拟化(vGPU)

4paradigm提供了k8s-device-plugin，该插件基于NVIDIA官方插件(NVIDIA/k8s-device-plugin)，在保留官方功能的基础上，实现了对物理GPU进行切分，并对显存和计算单元进行限制，从而模拟出多张小的vGPU卡。在k8s集群中，基于这些切分后的vGPU进行调度，使不同的容器可以安全的共享同一张物

2024年01月16日
浏览(60)
GPU 容器虚拟化新能力发布和全场景实践

今天给大家分享的主题是百度智能云在「GPU 容器虚拟化」方面的最新进展和全场景实践，希望通过这次分享和大家一起探讨如何在实际业务场景更好的应用 GPU 容器虚拟化技术。本次分享将首先介绍百度智能云 GPU 容器虚拟化 2.0 的升级变化，然后介绍新版本中的技术实现方

2024年02月14日
浏览(44)
GPU虚拟化理解包含直通，k8s安装，GPU-manager

vGPU，即真正意义上的GPU虚拟化方案，就是将一块GPU卡的计算能力进行切片，分成多个逻辑上虚拟的GPU，以vGPU为单位分配GPU的计算能力，并将单块GPU卡分配给多台虚拟机使用，使得虚拟机能够运行3D软件、播放高清视频等，极大地提升了用户体验。真正实现了GPU资源的按需分

2024年02月13日
浏览(47)
k8s中GPU虚拟化工具gpu-manager的安装

gpu-manager是腾讯的一个开源vGPU应用，具体原理就不介绍了，详见GPUManager虚拟化方案。本文主要参照腾讯开源vgpu方案gpu-manager安装教程进行安装，并就安装时出现的问题，对其中的部分配置进行了更改，如果根据上述文章安装失败，可以参考本文来进行安装。 gpu-manager不提供

2024年02月06日
浏览(41)
云计算——虚拟化层架构

作者简介：一名云计算网络运维人员、每天分享网络与运维的技术与干货。座右铭：低头赶路，敬事如仪个人主页：网络豆的主页本章将会讲解云计算的虚拟化层架构，了解云计算虚拟化层都有哪些架构模式。虚拟化层架构：全虚拟化，半虚拟化，硬件辅助

2024年02月11日
浏览(51)
云计算——虚拟化中的网络架构与虚拟网络（文末送书）

作者简介：一名云计算网络运维人员、每天分享网络与运维的技术与干货。公众号：网络豆座右铭：低头赶路，敬事如仪个人主页：网络豆的主页目录前期回顾前言一.网卡虚拟化 1.网卡虚拟化方法：（1）软件网卡虚拟化：（2）硬件网卡虚拟化二.虚

2024年02月11日
浏览(44)
Docker容器与虚拟化技术：Docker架构、镜像操作

目录一、理论 1.Doker概述 2.Docker核心概念 3.Docker安装 4.Docker的镜像管理命令二、实验 1.Docker安装 2.查看Docker信息 3.Docker的镜像管理命令三、问题 1.如何注册Docker账号 2.如何设置Docker公共存储库四、总结 (1) IT架构裸金属 → 虚拟机 → 容器→ 函数化、代码化云计算涌现出很

2024年02月10日
浏览(54)
Docker容器与虚拟化技术：Docker架构、镜像管理

目录一、理论 1.Doker概述 2.Docker核心概念 3.Docker安装 4.Docker的镜像管理命令二、实验 1.Docker安装 2.查看Docker信息 3.Docker的镜像管理命令三、问题 1.如何注册Docker账号 2.如何设置Docker公共存储库四、总结 (1) IT架构裸金属 → 虚拟机 → 容器→ 函数化、代码化云计算涌现出很

2024年02月13日
浏览(52)