TensorFlow Lite输入缓冲区初始化缓慢

时间:2020-08-16 15:38:57

标签: android kotlin tensor

我正在尝试

getInterpreter().runForMultipleInputsOutputs(inputArray, outputMap)

在Android Studio应用程序中,对于inputArray的初始化,我具有以下代码

val startTime = SystemClock.elapsedRealtimeNanos()
val inputArray = arrayOf(initInputArray(bitmap))
val endTime = SystemClock.elapsedRealtimeNanos() - startTime
Log.i(
"initInputArray",
String.format("Init took %.2f ms", 1.0f * endTime / 1_000_000)
)

init大约是4200 ms,initInputArray的内容如下:

private fun initInputArray(bitmap: Bitmap): ByteBuffer {
    val bytesPerChannel = 4
    val inputChannels = 3
    val batchSize = 1
    var intArraySize = bitmap.width * bitmap.height
    val inputBuffer = ByteBuffer.allocateDirect(
            batchSize * bytesPerChannel * bitmap.height * bitmap.width * inputChannels
    )
    inputBuffer.order(ByteOrder.nativeOrder())
    inputBuffer.rewind()
    val mean = 128.0f
    val std = 128.0f
    val intValues = IntArray(intArraySize)
    bitmap.getPixels(intValues, 0, bitmap.width, 0, 0, bitmap.width, bitmap.height)
    intValues.forEach {
      inputBuffer.putFloat(((it shr 16 and 0xFF) - mean) / std)
      inputBuffer.putFloat(((it shr 8 and 0xFF) - mean) / std)
      inputBuffer.putFloat(((it and 0xFF) - mean) / std)
    }
    return inputBuffer
  }

位图的大小为257像素宽和257像素高(66049字节)。

在移动设备上初始化输入缓冲区以进行对象检测的合适方法是什么,还有什么更快的方法,因为处理每个图像需要4秒钟,似乎很慢

谢谢您的时间!

0 个答案:

没有答案