1. 概述
mx-exporter是用于在集群环境中收集曦云® GPU设备指标数据的工具。集群监控系统Prometheus可以通过HTTP从运行于每个节点的mx-exporter拉取设备指标数据。 可视化工具Grafana将收集的GPU设备指标转化成易于理解的图表。
本文将介绍如何在Kubernetes集群中部署Prometheus,Grafana,mx-exporter来监控GPU设备。
mx-exporter指标及标签具体说明请参见《曦云系列® 通用计算GPU mx-exporter使用手册》