我有一个 recognizer
并使用它的 listen
函数从 SpeechCommandRecognizerResult.spectrogram.data
获取 Float32Array
数组,然后使用 concatenateFloat32Arrays
util 函数连接数组>
使用 SpeechCommandRecognizerResult.scores
函数时得分 (normalized
) 为 listen
,但是当我使用 recognize
函数并提供 {{1 }} 作为Float32Array
,得分为input
如何使用具有 not normalized
的 normalized
的 scores
函数获得 recognize
input
?
答案 0 :(得分:0)
仅仅因为你放入了一个规范化的数组并不意味着它会以这种方式出现。看起来识别器输出来自 listen
的输入音频的单词概率。来自代码 here
export interface SpeechCommandRecognizerResult {
/**
* Probability scores for the words.
*/
scores: Float32Array|Float32Array[];
虽然概率通常被归一化,但这个神经网络的输出概率可能仅用于相互比较以确定它是哪个词。找到输出数组的最大索引以获得它预测的单词。