我试图识别我拥有的文件(录制时间为10秒),但看起来Watson正在播放声音,并计算每秒音频的语音(或类似内容)。
是否可以代替那种方法立即将整个音频返回给我?比如不到3秒钟? (我问这个问题因为我现在正在使用AT&amp; T STT服务,它会非常快速地返回音频,比如最多3秒钟 - 我知道它使用IBM Watson ......)< / p>
根据他们的入门文档中的建议,这是我使用IBM.Watson.developer_cloud.speech_to_text SDK的Java代码:
log.info("Starting to recognize...");
getToken();
File audio = new File(recordingPath);
RecognizeOptions options = new RecognizeOptions.Builder().contentType(HttpMediaType.AUDIO_WAV)
.continuous(true).interimResults(true)
.build();
SpeechResults transcript = service.recognize(audio, options).execute();
lastRecognitionRequest = Calendar.getInstance();
String result = "";
for(Transcript t : transcript.getResults()) {
result = result.concat(t.getAlternatives().get(0).getTranscript());
}
log.info(result);
谢谢,