应用错误收集

API Google Speech to Text-mp3文件

时间：2018-09-19 19:24:48

标签： google-speech-api

我能够使用链接（https://cloud.google.com/speech-to-text/docs/async-recognize）中包含的教程来转录音频，但是它仅适用于WAV格式的音频。我想使其与MP3或M4A格式的音频一起使用。

我已经测试了链接（https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/Recognize。java）中包含的所有可能性，并遵循链接（https://cloud.google.com/speech-to-text/docs/encoding）中的准则

在Google Cloud主页上，Speech API演示工具可让您发送mp3文件，然后进行录音。

我希望社区帮助我以mp3格式录制1分钟以上的音频。

1 个答案:

答案 0 :(得分：1)

感谢您的帮助。但是让我以另一种方式解释它。

在link页上，介绍了使用音频文件进行转录的方法。但是，在GitHub中提供的所有可能性中，没有一种可以以WAV以外的格式转录音频。我的大多数文件都位于MP3和M4A中。

我总是得到以下答案：

Exception in thread" main "java.lang.IndexOutOfBoundsException: Index: 0 at java.util.Collections $ EmptyList.get (Collections.java:4454) at com.logusit.speech.speech.SpeechApplication.main (SpeechApplication.java:50)

我认为问题出在setEncoding和setSampleRateHertz参数的RecognitionConfig中。我找不到用于转录WAV以外文件的正确JAVA设置。