跳转到内容

GPU云实例使用技巧

计费

如何查看 GPU 容器实例的价格?

您可以在算力市场查看 GPU 实例的价格及其配置项(系统盘、云存储等)费用。

算力市场显示的为订单结算价格。

GPU 容器实例从什么时候开始计费?

从实例启动成功阶段开始计费。

实例

实例关机后为什么有时候会开机失败?

实例关机后,实例所属资源会被释放,如果实例所属资源已被抢占,则会造成无法再开机的情况。如果实例数据盘没有数据,您可以基于该实例保存镜像,然后基于保存的镜像来创建新的实例。

💡 提示

保存实例镜像后,系统盘的数据会随镜像被一起保存,而数据盘的数据不会。对于持久性要求比较高的数据,建议使用文件存储保存。

实例状态异常,如何处理?

请先尝试关机后再开机,如果无法解决,可联系我们

如何查看实例的显卡使用情况?

我们的 Docker 容器绝大部分镜像已内置英伟达显卡驱动,您可以直接使用

nvidia-smi

命令查看进程。

实例关机后SSH显示连接失败?

这是预期行为,不是故障。

关机 ≈ 把电脑电源拔掉,网卡都断电了,自然无法响应任何 TCP 22 端口的握手请求。

如需SSH连接,您可开机您的实例。

实例开通时忘记设置端口或需要添加新的端口怎么办?

如果您遇到此问题,无需释放此实例,可使用平台提供的“保存镜像”功能实现添加新端口,操作如下:

1、找到您需要操作的实例,选择“保存镜像”,待该镜像保存成功后进入下一步操作。注:镜像保存时间根据您的镜像大小不等。

2、选择“更换镜像”,选择“我的镜像”,选择您在第一步保存的镜像,此时根据界面提示,添加您所需要的业务端口,待更换完成,即实现了不释放实例新增端口的需求。

按需计费的容器实例余额不足系统自动释放后还能恢复吗?

按需计费的容器实例按每小时单价扣除账户余额,余额不足扣款失败会触发系统自动释放,数据不可恢复,请您时刻关注自己的余额变动情况。

我没有看到“复制/克隆实例”按钮,平台支持此功能吗?

平台是支持复制实例功能的,您可以通过镜像相关功能操作,具体参考【复制实例

💡 提示

此功能数据盘的数据并不能同步,请知悉

容器

容器支持海外科研资源加速吗?

平台暂不支持此功能,后续版本更新中将支持,请留意发版记录。

容器运行时显存不足,如何处理?

一般是由于模型过大,无法加载导致 OOM。请确认显存使用情况。

镜像

是否支持自定义镜像?

支持。在创建和升级实例时,可以指定自定义镜像。使用此功能前您需要创建私有镜像仓库,请参考【上传个人镜像

保存镜像失败,怎么办?

在控制台-镜像仓库-【我的镜像】,找到对应的保存镜像任务,您可以通过查看列表状态来确认问题。一般出现此问题是由于网络原因。您可以再次尝试保存,如无法解决,可联系我们

官方镜像不符合要求,怎么办?

您可以自行构建镜像或者直接使用 NVIDIA、DockerHub 的官方镜像上传到个人镜像仓库使用,如需更多支持,也可以联系我们

没有符合要求的 CUDA 版本,怎么办?

CUDA 版本向前兼容。例如,如果您的服务依赖 12.1 版本的 CUDA,可以选择带有大于或等于 12.1 版本 CUDA 的实例规格。

如何查看平台支持的最大 CUDA 版本?

您可以在算力市场页面,通过「支持CUDA版本」下拉列表确认支持的 CUDA 版本信息。

网络

如何配置端口映射?

  • 创建实例时,可以配置对外端口
  • 对于已有实例,支持修改对外端口。

能否支持独享 IP /独享带宽/专线?

可以支持。目前平台暂未对外开放这个能力。如有需求,请联系我们

是否支持 SFTP / SCP上传文件?

平台支持SFTP / SCP上传文件,具体操作可参考【文件数据上传

存储

系统盘、数据盘和文件存储有什么差异?

  • 系统盘
    • 不支持动态扩容,只能在创建实例时指定容量。
    • 挂载目录为/(不支持自定义)。
    • 保存镜像时会保存数据。
  • 数据盘
    • 支持动态扩容。
    • 默认挂载目录为/data(不支持自定义)。
    • 保存镜像时不会保存数据。
    • 读写速度与系统盘一致。
  • 文件存储
    • 支持动态扩容。
    • 默认挂载目录为/mydata(不支持自定义)。
    • 文件存储具有独立的生命周期,即使删除实例,文件存储的数据依然存在。
    • 读写速度整体比系统盘或本地盘稍慢(以具体使用情况为准)。
    • 文件存储按照容量和使用时长单独收费。

单个实例是否可以挂载多个文件存储卷?

控制台操作时,单个实例目前只能挂载一个文件存储卷。