14. 附录

14.1. 术语/缩略语

术语/缩略语

全称

说明

Batch

全部样本里的一批数据

BFC

Best-Fit with Coalescing

一种内存管理策略

CpuEP

CPU Execution Provider

以CPU作为ONNX Runtime的后端进行模型推理

LLM

Large Language Model

大语言模型

MacaConverter

沐曦研发,将训练的模型转换为ONNX模型的工具

MacaEP

MXMACA Execution Provider

以曦云系列GPU作为ONNX Runtime的后端进行模型推理

MacaPrecision

沐曦研发,精度对比工具

MacaQuantizer

沐曦研发,模型量化工具

MacaRT

MXMACA Runtime

沐曦研发,曦云系列GPU的推理引擎

ModelZoo

模型库

ONNX

Open Neural Network Exchange

开放神经网络交换,表示深度学习模型的开放格式,可将训练好的模型存储为此格式

ONNX Runtime

一个开源的跨平台推理框架

OpenPPL-LLM

OpenPPL推出的大语言模型(LLM)推理引擎

PMX

PPL Model Exchage

OpenPPL模型转换工具

Tensor

张量,是一种特殊的数据结构