ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Vitis AI 运行TensforFlow模型

2021-09-05 12:00:29  阅读:325  来源: 互联网

标签:AI 模型 -- Vitis TensforFlow 量化 input model


在百度edgeboard fzu3上运行CIFAR10 Classification,介绍Vitis AI TensorFlow设计过程,将Python描述的网络模型运行在Xilinx DPU上。

CIFAR_10数据集

输入图片32x32x8 RGB images,完整CIFAR数据集有60k图片,将数据集进行划分,50k进行训练,10k用来验证。

DenseNet结构

DenseNet-121组成:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zxWB5HX7-1630813493654)(./pic/densenet.png)]

注:上图针对ImageNet。

步骤

  • 拷贝文件
cp -r /mnt/hgfs/ubuntu/DenseNetX/ ~/
  • 下载模型

Vitis AI 1.2版本模型不能下载,使用Vitis AI1.3版本的模型,解压模型keras_model.zip,将k_model.h5拷贝到./files/build/keras_model 文件夹。

unzip keras_model.zip
cd keras_model/
cp k_model.h5 ../build/keras_model/
  • 运行docker
cd ~/Vitis-AI
./docker_run.sh xilinx/vitis-ai:1.2.82

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YzNxrM0T-1630813493656)(./pic/vitis-ai.png)]

  • 设置环境变量
cd DenseNetX/
source 0_setenv.sh 
  • 模型转换
source ./2_keras2tf.sh

完成两个转换:

1、将HDF5文件转换成TensorFlow checkpiont

2、 TensorFlow checkpiont转换成 frozen graph

在第二步中用到:

freeze() {
  freeze_graph \
    --input_meta_graph  ${TFCKPT_DIR}/${TFCKPT}.meta \
    --input_checkpoint  ${TFCKPT_DIR}/${TFCKPT} \
    --output_graph      ${FREEZE}/${FROZEN_GRAPH} \
    --output_node_names ${OUTPUT_NODE} \
    --input_binary      true
}

在./files/build/freeze文件夹生成frozen_graph.pb文件

  • 模型量化

在Vitis AI内可以量化模型,裁剪模型需要找xilinx。

量化将32bit float-point转换成8bit integer,不损失精度。Vitis AI支持通用神经网络 层,例如convoluton, pooling, fully connected, and batchnorm 。

Vitis AI quantizer支持TensorFlow,Pytorch和Caffe(quantzer名字vai_q_tensorflow, vai_q_pytorch, and vai_q_caffe )

  • 量化流程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HsUkJZq5-1630813493658)(./pic/quantizer.png)]

​ 量化器将float-point模型作为输入(frozen GraphDef fle for TensorFlow version, prototxt and caffemodel for Caffe version ),执行预处理(batchnorm 并移除无用节点), 然后将权重/偏差和激活量化为给定位宽 。

​ Vitis AI量化器经过多次推理迭代,进行校准,因此需要校准数据集。

​ 校准后,量化模型转换为DPU可部署模型(deploy_model.pb for vai_q_tensorflow or deploy.prototxt/deploy.caffemodel for vai_q_caffe )。

  • 使用 vai_q_tensorflow 量化模型

运行以下命令以量化模型:

$vai_q_tensorflow quantize \
--input_frozen_graph frozen_graph.pb \
--input_nodes ${input_nodes} \
--input_shapes ${input_shapes} \
--output_nodes ${output_nodes} \
--input_fn input_fn \
[options]
  • 输出量化模型

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xu3u7S3l-1630813493659)(./pic/output.png)]

  • 评估量化模型
source ./5_eval_quant.sh

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JPisYxtF-1630813493661)(./pic/eval.png)]

  • 编译量化模型

DPU参数包含在.dcf文件中,不同器件可能对应不同dcf,dcf文件通过如下命令生成

$ dlet -f ./system.hwh
[DLet]Generate DPU DCF file dpu-06-18-2020-12-00.dcf successfully.

system.hwh文件是在platform上创建应用时生成。

  • 修改arch.json

arch.json默认路径

export ARCH=/opt/vitis_ai/compiler/arch/DPUCZDX8G/${BOARD}/arch.json

将arch.json拷贝到

sudo cp arch.json /opt/vitis_ai/compiler/arch/DPUCZDX8G/ZCU104/

将dpu-06-18-2020-12-00.dcf文件拷贝到DenseNetX。

运行source ./6_compile.sh

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Iz5mwG4C-1630813493661)(./pic/densen.png)

在./files/build/compile文件夹生成dpu_densenetx_0.elf。

  • 单板上运行应用

    运行指令source ./7_make_target.sh,在./files/build/target文件夹生成如下文件

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hIvRVZmP-1630813493662)(./pic/app.png)]

  • 拷贝到sd卡
 scp -r ./target/ root@192.168.60.120: ~/
  • 运行代码
python3 app_mt.py

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4EpK1hNw-1630813493663)(./pic/thread1_0.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OerhMbIj-1630813493664)(./pic/thread1.png)]

python3 app_mt.py -t 5

[外链图片转存中...(img-9ucmqKxu-1630813493664)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qzloyODB-1630813493665)(./pic/thread2.png)]

在这里插入图片描述

标签:AI,模型,--,Vitis,TensforFlow,量化,input,model
来源: https://blog.csdn.net/clj609/article/details/120112576

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有