目录
目录
- 1. 概述
- 2. 环境依赖及MacaRT安装
- 3. MacaRT C++ API
- 4. MacaRT Python API
- 5. MacaRT工具链
- 5.1. MacaConverter
- 5.1.1. 安装
- 5.1.2. 功能列表
- 5.1.3. 使用说明
- 5.1.3.1. Caffe模型转ONNX模型
- 5.1.3.2. TensorFlow(H5)模型转ONNX模型
- 5.1.3.3. TensorFlow(SavedModel)模型转ONNX模型
- 5.1.3.4. TensorFlow(CheckPoint)模型转ONNX模型
- 5.1.3.5. TensorFlow(pb)模型转ONNX模型
- 5.1.3.6. PyTorch模型转ONNX模型(输入包含模型定义和权重)
- 5.1.3.7. PyTorch模型转ONNX模型(输入仅包含权重)
- 5.1.3.8. PyTorch模型转ONNX模型(输入仅包含权重,且模型定义在Torchvision中)
- 5.1.3.9. Darknet模型转ONNX模型
- 5.1.3.10. PaddlePaddle模型转ONNX模型(输入包含权重和定义)
- 5.1.3.11. PaddlePaddle模型转ONNX模型(输入仅包含权重)
- 5.1.3.12. PaddlePaddle模型转ONNX模型(输入仅包含权重,模型在paddle.vision中定义)
- 5.1.3.13. 动态Batch转换
- 5.1.3.14. ONNX简化
- 5.1.3.15. FP32转FP16
- 5.1.3.16. 子图提取
- 5.1.3.17. op_set版本转换
- 5.1.3.18. Pad融合
- 5.1.3.19. Float32转Uint8(仅针对模型的input数据,非所有算子)
- 5.1.3.20. MatMul+Add融合为Gemm
- 5.1.3.21. MHA融合
- 5.2. MacaPrecision
- 5.3. MacaQuantizer
- 5.1. MacaConverter
- 6. MacaRT-LLM
- 7. MacaRT-vLLM
- 8. MacaRT-ModelZoo
- 9. MacaRT-LMDeploy
- 10. Diffusers
- 11. Transformers
- 12. MacaRT-SGLang
- 13. 附录