【文件属性】:
文件名称:pytorch-operator:PyTorch是Kubernetes
文件大小:28.5MB
文件格式:ZIP
更新时间:2021-05-03 17:01:03
Jsonnet
用于PyTorch作业的Kubernetes自定义资源和操作员
概述
该存储库包含PyTorchJob自定义资源定义的规范和实现。 使用此自定义资源,用户可以像Kubernetes中的其他内置资源一样创建和管理PyTorch作业。 参见
先决条件
Kubernetes> = 1.8
安装PyTorch操作员
请参考的安装说明。 这将安装pytorchjob CRD和pytorch-operator控制器来管理PyTorch作业的生命周期。
创建一个PyTorch作业
您可以通过定义PyTorchJob配置文件来创建PyTorch作业。 有关请参见清单。 您可以根据需要更改配置文件。
cat examples/mnist/v1/pytorch_job_mnist_gloo.yaml
部署PyTorchJob资源以开始培训:
kubectl create -f examples/mnist