应用错误收集

如何在ARM设备上使Tensorflow Lite更快（运行量化的tflite mobilenet v1模型）

时间：2018-08-07 22:45:49

标签： tensorflow arm tensorflow-lite

我已经在Pixel 2上测试了tflite对象检测示例。令人惊讶的是，推理时间低至〜50ms。问题是：我们可以在ARM设备上更快地做到这一点吗？

mobilenet v1中的两个主要操作是CONV_2D和DEPTHWISE_CONV_2D。对于CONV_2D，我们拥有gemmlowp库的支持，该库同时使用内联NEON汇编和多线程。但是，对于DEPTHWISE_CONV_2D，它仅使用NEON内部函数。 tensorflow团队将来会使用NEON组件实现它吗？

还有其他方法可以减少推理时间吗？任何想法都将受到高度赞赏！

0 个答案:

没有答案

在Android上使用mobilenet V1模型
使用toco失败
使用MobileNet-SSD v1模型在TensorFlow Lite C ++中进行对象检测
如何训练mobilenet-v1量化模型以在TF Lite上使用
如何在ARM设备上使Tensorflow Lite更快（运行量化的tflite mobilenet v1模型）
如何使用量化的Tensorflow MobileNet v1浮点缩放值
我的tflite模型中一些未量化的图层
如何将TFlite量化模型转换为Float模型？
使用ssd mobilenet v1将.pb转换为.tflite
将Mobilenet细分模型转换为tflite

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？