3. mx-exporter部署

本节介绍两种在Kubernetes上部署mx-exporter的方式,用户可根据需要选择一种。

3.1. Helm方式部署

Helm在 mx-exporter/deployment/mx-exporter/helm 内,可按需设置下表参数,在安装时用 --set 传入以生效。

表 3.1 Helm方式部署exporter参数

参数

类型

描述

image.repository

string

镜像地址,默认为cr.metax-tech.com/cloud/mx-exporter

image.tag

string

镜像版本号

service.port

integer

设置mx-exporter pod中container的端口,默认为8000

gatherInterval

integer

指标收集间隔,默认为10000ms

用户根据mx-exporter镜像信息设置 image.repositoryimage.tag

操作步骤(部署mx-exporter)

  1. 部署mx-exporter,回显信息如图 3.1 所示。

    cd mx-exporter/deployment/mx-exporter/helm; helm install metax-mx-exporter mx-exporter -n metax-monitor --set image.repository=xxx --set image.tag=xxxx
    
    ../_images/HelmDeployExporter.png

    图 3.1 Helm方式部署mx-exporter

  2. 查看新建资源信息,回显信息如图 3.2 所示。

    helm list -n metax-monitor
    kubectl get all -n metax-monitor -o wide
    
    ../_images/CheckHelmExporter.png

    图 3.2 查看新建资源信息(Helm)

默认每个节点都已部署mx-exporter。需记录mx-exporter pod IP,在Grafana后续展示中用于筛选需要展示指标的目标服务器。

查看抓取信息

mx-exporter部署成功后,等待40秒,可在k8s中用 curl 命令查看mx-exporter抓取的GPU信息,回显信息如图 3.3 所示。

curl <mx-exporter_pod_ip>:<mx-exporter_service_port>/metrics
../_images/CheckCurlInfoHelm.png

图 3.3 查看mx-exporter抓取信息(Helm)

删除资源

如需删除资源,可使用以下命令:

helm uninstall metax-mx-exporter -n metax-monitor

3.2. YAML方式部署

如需修改下表参数,可编辑mx-exporter/deployment/mx-exporter/mx-exporter-daemonset.yaml

表 3.2 YAML方式部署exporter参数

参数

类型

描述

image

string

镜像地址:Tag号,用户根据导入的mx-exporter镜像信息设置

-c

string

用户自定义的指标配置文件,默认在 /etc/config/metrics

-p

integer

port,设置端口,默认为8000

-i

integer

interval,指标收集间隔,在containers.args中,默认为10000ms

操作步骤(部署mx-exporter)

  1. 部署mx-exporter。

    cd mx-exporter/deployment/mx-exporter; kubectl create -f mx-exporter-daemonset.yaml
    

    回显信息如下:

    serviceaccount/metax-mx-exporter created
    configmap/exporter-metrics-config-map created
    service/metax-mx-exporter created
    daemonset.apps/metax-mx-exporter created
    
  2. 查看新建资源信息,回显信息如图 3.4 所示。

    kubectl get all -n metax-monitor -o wide
    
    ../_images/CheckExporterYaml.png

    图 3.4 查看新建资源信息(YAML)

默认每个节点都已部署mx-exporter。记录mx-exporter pod IP,在Grafana后续展示中用于筛选需要展示指标的目标服务器。

查看抓取信息

mx-exporter部署成功后,等待40秒,可在k8s中用 curl 命令查看mx-exporter抓取的GPU信息,回显信息如图 3.5 所示。

curl <mx-exporter_pod_ip>:<mx-exporter_service_port>/metrics
../_images/CheckCurlInfoYaml.png

图 3.5 查看mx-exporter抓取信息(YAML)

删除资源

如需删除资源,可使用以下命令:

cd mx-exporter/deployment/mx-exporter; kubectl delete -f .