Google Speech API元数据不会影响结果或转换方法

时间:2018-06-22 17:53:20

标签: speech-recognition speech-to-text google-speech-api google-cloud-speech

我正在使用以下功能参数将语音转换为文本,但是我为元数据参数设置的额外参数对有或没有参数的转换结果都没有影响。

function transcribe_async_gcs($ bucketName,$ objectName,$ languageCode ='en-US',$ options = ['enableAutomaticPunctuation'=> true,'enableWordTimeOffsets'=> false,'encoding'=>'FLAC','sampleRateHertz '=> 44100,“元数据” => [[“ interactionType” =>“ PHONE_CALL”,“ industryNaicsCodeOfAudio” => 621210,“ microphoneDistance” =>“ NEARFIELD”,     “ originalMediaType” =>“ AUDIO”,“ recordingDeviceType” =>“ PHONE_LINE”,“ originalMimeType” =>“ audio / mp3”,“ audioTopic” =>“约会”],'useEnhanced'=> true])

1 个答案:

答案 0 :(得分:0)

为了提高语音识别的准确性,除了元数据[1]之外,您还可以在配置[2]中提供短语提示。如果您知道语音的上下文,则可以提高准确性。还有一个选项可以使用增强的语音识别模型来获得更好的质量[3],在这种情况下,您需要选择加入数据记录并能够使用特殊的机器学习模型集。这些都是可选字段,与音频内容有关的内容可能会或可能不会影响结果。