标签:engine 200 记录 -- fp32 uff chw
网上找了篇文章,用tensorrt自带转换工具trtexec转成engine格式的方法,网址如下:
https://www.cnblogs.com/xiaoxiaomajinjiebiji/p/14451398.html
文章中举例的转换指令为:
/usr/src/tensorrt/bin/trtexec --uff=/home/model/model.uff --uffInput=input_1,1,3,224,224 --output=softmax/Softmax --saveEngine=/home/model/model.engine --outputIOFormats=fp32:chw --buildOnly --useCudaGraph
其中--uffInput后面跟的是模型输入节点名称和训练模型的图像尺寸,但是中间多了个1不知道是啥意思
--output为模型的输出节点名称
--outputIOFormats=fp32:chw中fp32为模型的精度,chw为模型输出的格式
所以根据上述指令说明,再按我的模型,我的转换指令:
trtexec --uff=REF-DEFECT_1-200-200__0810005631.uff --uffInput=InputNode,1,200,200 --output=score --saveEngine=REF-DEFECT_1-200-200__0810005631.engine --outputIOFormats=fp16:chw --buildOnly --useCudaGraph
其中为提高推理速度,模型输出精度我改成了fp16,测试了下,发现预测结果不正确
后面改成fp32,预测结果正确
最终正确转换指令为:
trtexec --uff=REF-DEFECT_1-200-200__0810005631.uff --uffInput=InputNode,1,200,200 --output=score --saveEngine=REF-DEFECT_1-200-200__0810005631.engine --outputIOFormats=fp32:chw --buildOnly --useCudaGraph
tensorrt版本为:TensorRT-8.0.3.4.Windows10.x86_64.cuda-11.3.cudnn8.2
标签:engine,200,记录,--,fp32,uff,chw 来源: https://www.cnblogs.com/baoxuhong/p/16615796.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。