Question

我试图识别我拥有的文件（录制时间为10秒），但看起来Watson正在播放声音，并计算每秒音频的语音（或类似内容）。

是否可以代替那种方法立即将整个音频返回给我？比如不到3秒钟？（我问这个问题因为我现在正在使用AT＆amp; T STT服务，它会非常快速地返回音频，比如最多3秒钟 - 我知道它使用IBM Watson ......）< / p>

根据他们的入门文档中的建议，这是我使用IBM.Watson.developer_cloud.speech_to_text SDK的Java代码：

    log.info("Starting to recognize...");
    getToken();
    File audio = new File(recordingPath);
    RecognizeOptions options = new RecognizeOptions.Builder().contentType(HttpMediaType.AUDIO_WAV)
            .continuous(true).interimResults(true)
            .build();
    SpeechResults transcript = service.recognize(audio, options).execute();
    lastRecognitionRequest = Calendar.getInstance();

    String result = "";
    for(Transcript t : transcript.getResults()) {
        result = result.concat(t.getAlternatives().get(0).getTranscript());
    }

    log.info(result);

谢谢，

如何将IBM Watson Speech设置为Text以立即识别文件？

0 个答案: