Triton部署之TensorRT-bugfix

9月前作者：MaxSimpleLearning 分类：Toy博客阅读(33) 违法举报

这篇具有很好参考价值的文章主要介绍了Triton部署之TensorRT-bugfix。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、前言

Triton部署经常会有一些姨妈的错误，个人经验大都为版本不匹配导致；

二、本人环境

nvidia-smi:

Triton部署之TensorRT-bugfix,python,人工智能

使用的官方镜像为：nvcr.io/nvidia/tritonserver:21.09-py3
使用的onnx版本为：pip install onnx == 1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
对应的版本链接可参考官网：
https://docs.nvidia.com/deeplearning/triton-inference-server/release-notes/rel_21-09.html#rel_21-09
除此之外，环境依赖安装了: pip install nvidia-pyindex nvidia-dali-cuda110

三、报错信息

报错信息如下：
E0719 02:45:05.225510 2971 logging.cc:43] 6: The engine plan file is not compatible with this version of TensorRT, expecting library version 8.0.3 got 8.0.1, please rebuild.
E0719 02:45:05.225711 2971 logging.cc:43] 4: [runtime.cpp::deserializeCudaEngine::75] Error Code 4: Internal Error (Engine deserialization failed.)

四、解决方案

1、原因很明显为8.0.1版本的TensorRT导致了不兼容问题，故重装了对应的tensorRT版本为：

pip install nvidia-tensorrt==8.0.3

2、重新模型转换：model.onnx --> model.plan

3、放到对应的Triton模型目录下：很奇怪的是为什么都要命名为model.onnx 或者 model.plan，可能内定写死了？反正我改名就可以检测到了；

五、参考链接

附上官网的用使用手册：Quickstart — NVIDIA Triton Inference Server

有问题随时联系，欢迎一键三连！文章来源地址https://www.toymoban.com/news/detail-582279.html

到了这里，关于Triton部署之TensorRT-bugfix的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【TensorRT】TensorRT 部署Yolov5模型（C++）

该项目代码在本人GitHub代码仓库开源，本人GitHub主页为：GitHub 项目代码： NVIDIA TensorRT™ 是用于高性能深度学习推理的 SDK，可为深度学习推理应用提供低延迟和高吞吐量。详细安装方式参考以下博客： NVIDIA TensorRT 安装 (Windows C++) 经典的一个TensorRT部署模型步骤为

2023年04月26日
浏览(48)
【TensorRT】基于C#调用TensorRT 部署Yolov5模型 - 上篇：构建TensorRTSharp

NVIDIA TensorRT™ 是用于高性能深度学习推理的 SDK，可为深度学习推理应用提供低延迟和高吞吐量。详细安装方式参考以下博客： NVIDIA TensorRT 安装 (Windows C++) 前文中已经介绍了在C++中利用TensorRT 部署Yolov5模型，但在实际应用中，经常会出现在C#中部署模型的需求，目前T

2023年04月24日
浏览(49)
【模型部署】TensorRT的安装与使用

https://blog.csdn.net/qq_44747572/article/details/122453926?spm=1001.2014.3001.5502 下载链接：https://developer.nvidia.com/nvidia-tensorrt-8x-download 我的cuda版本是11.0，因此下面以此做演示：下载tensorRT的zip文件将下载好的文件夹进行解压：系统环境配置：高级系统环境–环境变量–系统变量–Path（添

2024年02月15日
浏览(39)
pointnet C++推理部署--tensorrt框架

python推理： C++推理：其中推理引擎的构建也可以直接使用tensorrt的bin目录下的trtexec.exe。 LZ也实现了cuda版本的前处理代码，但似乎效率比cpu前处理还低。可能是数据量不够大吧（才10^3数量级），而且目前LZ的cuda水平也只是入门阶段… python推理： C++推理： python推理： C++推理

2024年02月11日
浏览(34)
TensorRT部署--Linux(Ubuntu)环境配置

TensorRT环境配置–Linux(Ubuntu) TensorRT部署-Windows环境配置: https://blog.csdn.net/m0_70420861/article/details/135658922?spm=1001.2014.3001.5502 如果还未配置环境的话，nvidia-smi是不会显示的。以CUDA-BEVFusion部署为例搭建环境: https://github.com/NVIDIA-AI-IOT/Lidar_AI_Solution/tree/master/CUDA-BEVFusion 查看兼容性：

2024年01月23日
浏览(38)
HRNet语义分割训练及TensorRT部署

环境构建 1. 创建虚拟环境 2. 安装cuda和cudnn 3. 安装pytorch 4. 下载项目代码或者直接从 https://github.com/HRNet/HRNet-Semantic-Segmentation/tree/HRNet-OCR 处下载zip包 5. 安装项目依赖的其他包数据整理 1. 标注使用labelme或其他标注工具做语义分割标注，网上关于labelme标注的教程很多，且操作

2024年02月07日
浏览(32)
ubuntu下yolox tensorrt模型部署

TensorRT系列之 Windows10下yolov8 tensorrt模型加速部署 TensorRT系列之 Linux下 yolov8 tensorrt模型加速部署 TensorRT系列之 Linux下 yolov7 tensorrt模型加速部署 TensorRT系列之 Linux下 yolov6 tensorrt模型加速部署 TensorRT系列之 Linux下 yolov5 tensorrt模型加速部署 TensorRT系列之 Linux下 yolox tensorrt模型加速部

2024年02月06日
浏览(52)
TensorRT模型优化部署 (八）--模型剪枝Pruning

第一章 TensorRT优化部署（一）–TensorRT和ONNX基础第二章 TensorRT优化部署（二）–剖析ONNX架构第三章 TensorRT优化部署（三）–ONNX注册算子第四章 TensorRT模型优化部署（四）–Roofline model 第五章 TensorRT模型优化部署（五）–模型优化部署重点注意第六章 TensorRT模型优化部署（

2024年01月20日
浏览(37)
记录我的tensorrt 部署yolov8

系统：ubuntu 18.04 代码：https://github.com/triple-Mu/YOLOv8-TensorRT conda 环境：按照上面代码环境安装 python==3.8 cuda : 11.8 tensorrt : 8.5.1.7-1+cuda11.8 没有cudnn nvidia-tensorrt(conda) : 8.4.1.5 Driver Version: 530.41.03 在我电脑上加速 3倍左右我电脑设备 3060

2024年02月10日
浏览(31)
YOLOv5 Tensorrt Python/C++部署

https://www.bilibili.com/video/BV113411J7nk?p=1 https://github.com/Monday-Leo/Yolov5_Tensorrt_Win10 基于 Tensorrt 加速 Yolov5 6.0 支持 Windows10 支持 Python/C++ Tensorrt 8.2.1.8 Cuda 10.2 Cudnn 8.2.1( 特别注意需安装两个cuda10.2补丁 ) Opencv 3.4.6 Cmake 3.17.1 VS 2017 GTX1650 从yolov5 release v6.0下载.pt模型，这里以yolov5s.pt为例。

2024年01月21日
浏览(47)