API Google Speech to Text-mp3文件

时间:2018-09-19 19:24:48

标签: google-speech-api

我能够使用链接(https://cloud.google.com/speech-to-text/docs/async-recognize)中包含的教程来转录音频,但是它仅适用于WAV格式的音频。我想使其与MP3或M4A格式的音频一起使用。

我已经测试了链接(https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/Recognize。java)中包含的所有可能性,并遵循链接(https://cloud.google.com/speech-to-text/docs/encoding)中的准则

在Google Cloud主页上,Speech API演示工具可让您发送mp3文件,然后进行录音。

我希望社区帮助我以mp3格式录制1分钟以上的音频。

1 个答案:

答案 0 :(得分:1)

感谢您的帮助。但是让我以另一种方式解释它。

link页上,介绍了使用音频文件进行转录的方法。但是,在GitHub中提供的所有可能性中,没有一种可以以WAV以外的格式转录音频。我的大多数文件都位于MP3和M4A中。

我总是得到以下答案:

Exception in thread" main "java.lang.IndexOutOfBoundsException: Index: 0 at java.util.Collections $ EmptyList.get (Collections.java:4454) at com.logusit.speech.speech.SpeechApplication.main (SpeechApplication.java:50)

我认为问题出在setEncoding和setSampleRateHertz参数的RecognitionConfig中。我找不到用于转录WAV以外文件的正确JAVA设置。