Vision Transformer,一个简单的方法来实现SOTA的视觉分类,只有一个单一的变压器编码器。提出了一种新的图像到补丁函数,该函数在对图像进行归一化并将图像划分为多个补丁之前,将图像的偏移量纳入到图像到补丁函数中。
论文:[《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE》](https://openreview.net/pdf?id=YicbFdNTTy)
开源模型链接:https://github.com/lucidrains/vit-pytorch
数据集(ImageNet):http://www.image-net.org/
数据集资源下载
ImageNet是一个不可用于商业目的的数据集,必须通过教育网邮箱注册登录后下载,请前往官方自行下载 ImageNet 2012 val。
模型资源下载
清微github modelzoo仓库下载
git clone https://github.com/tsingmicro-toolchain/ts.knight-modelzoo.git
联系清微智能获取Knight工具链版本包 ReleaseDeliverables/ts.knight-x.x.x.x.tar.gz
。下面以ts.knight-3.0.0.11.build1.tar.gz为例演示。
检查docker环境
默认服务器中已安装docker(版本>=19.03), 如未安装可参考文档ReleaseDocuments/《TS.Knight-使用指南综述_V3.0.11.pdf》。
docker -v
加载镜像
docker load -i ts.knight-3.0.0.11.build1.tar.gz
启动docker容器
docker run -v ${localhost_dir}/ts.knight-modelzoo:/ts.knight-modelzoo -it ts.knight:3.0.0.11.build1 /bin/bash
localhost_dir为宿主机目录。
模型准备
如上述"Knight环境准备"章节所述,准备好vit_tiny pytorch权重文件。
量化数据准备
将下载好的数据放在${localhost_dir}/ts.knight-modelzoo/pytorch/builtin/cv/classification/vit_tiny/data/imagenet/images/val
,并执行valprep.sh脚本对图片进行分类。
模型转换函数、推理函数准备
已提供量化依赖的模型转换和推理函数py文件: /ts.knight-modelzoo/pytorch/builtin/cv/classification/vit_tiny/src/vit_tiny.py
执行量化命令
在容器内执行如下量化和编译命令,具体量化、编译参数可见 vit_tiny_config.json。
Knight --chip TX5368AV200 build --run-config data/vit_tiny_config.json
量化后模型推理
Knight --chip TX5368AV200 quant --run-config data/vit_tiny_infer_config.json
#准备bin数据 python src/make_image_input_onnx.py --input data/demo.jpg --outpath /TS-KnightDemo/Output/vit_tiny/npu #仿真 Knight --chip TX5368AV200 run --run-config data/vit_tiny_config.json #仿真输出txt文件转numpy show_sim_result --sim-data /TS-KnightDemo/Output/vit_tiny/npu/result-*_p.txt --save-dir /TS-KnightDemo/Output/vit_tiny/npu/ #模型后处理 python src/post_process.py --numpys /TS-KnightDemo/Output/deit_tiny/npu/result-*_p.npy
Knight --chip TX5368AV200 profiling --run-config data/vit_tiny_config.json
芯片系列 | 是否支持 |
---|---|
TX510x | 支持 |
TX5368x_TX5339x | 支持 |
TX5215x_TX5239x200_TX5239x220 | 支持 |
TX5112x201_TX5239x201 | 支持 |
TX5336AV200 | 支持 |
2023/11/23 第一版
ModelZoo Edge 的 License 具体内容请参见LICENSE文件
您明确了解并同意,以上链接中的软件、数据或者模型由第三方提供并负责维护。在以上链接中出现的任何第三方的名称、商标、标识、产品或服务并不构成明示或暗示与该第三方或其软件、数据或模型的相关背书、担保或推荐行为。您进一步了解并同意,使用任何第三方软件、数据或者模型,包括您提供的任何信息或个人数据(不论是有意或无意地),应受相关使用条款、许可协议、隐私政策或其他此类协议的约束。因此,使用链接中的软件、数据或者模型可能导致的所有风险将由您自行承担。