Tensorflow 语音命令识别分数

时间:2020-12-28 23:45:00

标签: javascript tensorflow machine-learning speech-recognition tensorflow.js

我有一个 recognizer 并使用它的 listen 函数从 SpeechCommandRecognizerResult.spectrogram.data 获取 Float32Array 数组,然后使用 concatenateFloat32Arrays util 函数连接数组

使用 SpeechCommandRecognizerResult.scores 函数时得分 (normalized) 为 listen,但是当我使用 recognize 函数并提供 {{1 }} 作为Float32Array,得分为input

如何使用具有 not normalizednormalizedscores 函数获得 recognize input

1 个答案:

答案 0 :(得分:0)

仅仅因为你放入了一个规范化的数组并不意味着它会以这种方式出现。看起来识别器输出来自 listen 的输入音频的单词概率。来自代码 here

export interface SpeechCommandRecognizerResult {
  /**
   * Probability scores for the words.
   */
  scores: Float32Array|Float32Array[];

虽然概率通常被归一化,但这个神经网络的输出概率可能仅用于相互比较以确定它是哪个词。找到输出数组的最大索引以获得它预测的单词。