ECCV 2022丨轻量级模型架构火了,力压苹果MobileViT(3)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
研究者还将ParC和squeeze exictation结合起来,构建了一个纯卷积结构的meta former结构。该结构舍弃了自注意力硬件支持不友好的操作,但保留了传统Transformer块提取全局特征的特点。 研 究者还 在channe l mixer部分引入硬件支持较友好的通道注意力机制,使其纯卷积meta former结构也具备自注意力的特点。 基于ParC结构最终得到的ParC块,可作为一个即插即用的基础单元,替换现有ViT或ConvNet模型中的相关块,从而提升精度,并降低计算成本,有效克服硬件支持的问题。 三种主要的混合结构。(a) serial structure; (b) parallel structure; (c) bifurcate structure。
04
实验分析
在图像分类实验中,对于ImageNet-1k的分类,ParC-Net使用的参数规模最小(约500万个参数),却实现了 最高准确率78.6% 。 MobileViT是Apple2022年在国际深度学习顶会ICLR22上提出的轻量级通用ViT模型。同样部署在基于Arm的瑞芯微RK3288芯片上,相较基线模型MobileViT, ParC-Net节省了11%的参数和13%的计算成本,同时准确率提高了0.2%,推理速度提高了23% 。 MS-COCO物体检测实验结果 PASCAL VOC分割任务实验结果 研究者将ParC-Net和基线模型MobileVit均部署到自研低功耗芯片DP上进行推理速度测试。从实验结果可以看到,ParC-Net的推理速度能够达到MobileViT速度的3~4倍。 ©THE END 转载请联系本公众号获得授权
99科技网:http://www.99it.com.cn
