14. 附录
14.1. 术语/缩略语
术语/缩略语 |
全称 |
说明 |
|---|---|---|
Batch |
全部样本里的一批数据 |
|
BFC |
Best-Fit with Coalescing |
一种内存管理策略 |
CpuEP |
CPU Execution Provider |
以CPU作为ONNX Runtime的后端进行模型推理 |
LLM |
Large Language Model |
大语言模型 |
MacaConverter |
沐曦研发,将训练的模型转换为ONNX模型的工具 |
|
MacaEP |
MXMACA Execution Provider |
以曦云系列GPU作为ONNX Runtime的后端进行模型推理 |
MacaPrecision |
沐曦研发,精度对比工具 |
|
MacaQuantizer |
沐曦研发,模型量化工具 |
|
MacaRT |
MXMACA Runtime |
沐曦研发,曦云系列GPU的推理引擎 |
ModelZoo |
模型库 |
|
ONNX |
Open Neural Network Exchange |
开放神经网络交换,表示深度学习模型的开放格式,可将训练好的模型存储为此格式 |
ONNX Runtime |
一个开源的跨平台推理框架 |
|
OpenPPL-LLM |
OpenPPL推出的大语言模型(LLM)推理引擎 |
|
PMX |
PPL Model Exchage |
OpenPPL模型转换工具 |
Tensor |
张量,是一种特殊的数据结构 |