主题
GPU云实例使用技巧
计费
如何查看 GPU 容器实例的价格?
您可以在算力市场查看 GPU 实例的价格及其配置项(系统盘、云存储等)费用。
算力市场显示的为订单结算价格。
GPU 容器实例从什么时候开始计费?
从实例启动成功阶段开始计费。
实例
实例关机后为什么有时候会开机失败?
实例关机后,实例所属资源会被释放,如果实例所属资源已被抢占,则会造成无法再开机的情况。如果实例数据盘没有数据,您可以基于该实例保存镜像,然后基于保存的镜像来创建新的实例。
💡 提示
保存实例镜像后,系统盘的数据会随镜像被一起保存,而数据盘的数据不会。对于持久性要求比较高的数据,建议使用文件存储保存。
实例状态异常,如何处理?
请先尝试关机后再开机,如果无法解决,可联系我们。
如何查看实例的显卡使用情况?
我们的 Docker 容器绝大部分镜像已内置英伟达显卡驱动,您可以直接使用
nvidia-smi命令查看进程。
实例关机后SSH显示连接失败?
这是预期行为,不是故障。
关机 ≈ 把电脑电源拔掉,网卡都断电了,自然无法响应任何 TCP 22 端口的握手请求。
如需SSH连接,您可开机您的实例。
实例开通时忘记设置端口或需要添加新的端口怎么办?
如果您遇到此问题,无需释放此实例,可使用平台提供的“保存镜像”功能实现添加新端口,操作如下:
1、找到您需要操作的实例,选择“保存镜像”,待该镜像保存成功后进入下一步操作。注:镜像保存时间根据您的镜像大小不等。
2、选择“更换镜像”,选择“我的镜像”,选择您在第一步保存的镜像,此时根据界面提示,添加您所需要的业务端口,待更换完成,即实现了不释放实例新增端口的需求。
按需计费的容器实例余额不足系统自动释放后还能恢复吗?
按需计费的容器实例按每小时单价扣除账户余额,余额不足扣款失败会触发系统自动释放,数据不可恢复,请您时刻关注自己的余额变动情况。
我没有看到“复制/克隆实例”按钮,平台支持此功能吗?
平台是支持复制实例功能的,您可以通过镜像相关功能操作,具体参考【复制实例】
💡 提示
此功能数据盘的数据并不能同步,请知悉
容器
容器支持海外科研资源加速吗?
平台暂不支持此功能,后续版本更新中将支持,请留意发版记录。
容器运行时显存不足,如何处理?
一般是由于模型过大,无法加载导致 OOM。请确认显存使用情况。
镜像
是否支持自定义镜像?
支持。在创建和升级实例时,可以指定自定义镜像。使用此功能前您需要创建私有镜像仓库,请参考【上传个人镜像】
保存镜像失败,怎么办?
在控制台-镜像仓库-【我的镜像】,找到对应的保存镜像任务,您可以通过查看列表状态来确认问题。一般出现此问题是由于网络原因。您可以再次尝试保存,如无法解决,可联系我们。
官方镜像不符合要求,怎么办?
您可以自行构建镜像或者直接使用 NVIDIA、DockerHub 的官方镜像上传到个人镜像仓库使用,如需更多支持,也可以联系我们。
没有符合要求的 CUDA 版本,怎么办?
CUDA 版本向前兼容。例如,如果您的服务依赖 12.1 版本的 CUDA,可以选择带有大于或等于 12.1 版本 CUDA 的实例规格。
如何查看平台支持的最大 CUDA 版本?
您可以在算力市场页面,通过「支持CUDA版本」下拉列表确认支持的 CUDA 版本信息。
网络
如何配置端口映射?
- 创建实例时,可以配置对外端口。
- 对于已有实例,支持修改对外端口。
能否支持独享 IP /独享带宽/专线?
可以支持。目前平台暂未对外开放这个能力。如有需求,请联系我们。
是否支持 SFTP / SCP上传文件?
平台支持SFTP / SCP上传文件,具体操作可参考【文件数据上传】
存储
系统盘、数据盘和文件存储有什么差异?
- 系统盘
- 不支持动态扩容,只能在创建实例时指定容量。
- 挂载目录为
/(不支持自定义)。 - 保存镜像时会保存数据。
- 数据盘
- 支持动态扩容。
- 默认挂载目录为
/data(不支持自定义)。 - 保存镜像时不会保存数据。
- 读写速度与系统盘一致。
- 文件存储
- 支持动态扩容。
- 默认挂载目录为
/mydata(不支持自定义)。 - 文件存储具有独立的生命周期,即使删除实例,文件存储的数据依然存在。
- 读写速度整体比系统盘或本地盘稍慢(以具体使用情况为准)。
- 文件存储按照容量和使用时长单独收费。
单个实例是否可以挂载多个文件存储卷?
控制台操作时,单个实例目前只能挂载一个文件存储卷。