如何使用Codename One的Google Speech API?

时间:2016-09-11 06:11:22

标签: speech-recognition codenameone google-speech-api

我想从手机录制音频,然后将其发送到谷歌语音非流媒体API。我可以使用Capture.captureAudio()进行录制,但后来我不知道音频编码和采样率是多少,因为它们需要for the api request。 如何获取音频编码和采样率,以便我可以使用我的API请求发送它们?

1 个答案:

答案 0 :(得分:1)

如果您检查Android上的sources,则会在AMR-WB中记录

        recorder.setAudioSource(MediaRecorder.AudioSource.MIC);
        recorder.setOutputFormat(MediaRecorder.OutputFormat.THREE_GPP);
        recorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_WB);
        recorder.setOutputFile(temp.getAbsolutePath());

如果您set audio format {。}},Google语音API会接受AMR-WB。

另一个问题是文件在3GPP容器中被记录为AMR-WB,因此您需要一个自定义代码从3GPP中提取音频数据,您可以找到它here

// #!AMR\n
private static byte[] AMR_MAGIC_HEADER = {0x23, 0x21, 0x41, 0x4d, 0x52, 0x0a};


public byte[] convert3gpDataToAmr(byte[] data) {
    if (data == null) {
        return null;
    }

    ByteArrayInputStream bis = new ByteArrayInputStream(data);
    // read FileTypeHeader
    FileTypeBox ftypHeader = new FileTypeBox(bis);
    // You can check if it is correct here
    // read MediaDataHeader
    MediaDataBox mdatHeader = new MediaDataBox(bis);
    // You can check if it is correct here
    int rawAmrDataLength = mdatHeader.getDataLength();
    int fullAmrDataLength = AMR_MAGIC_HEADER.length + rawAmrDataLength;
    byte[] amrData = new byte[fullAmrDataLength];
    System.arraycopy(AMR_MAGIC_HEADER, 0, amrData, 0, AMR_MAGIC_HEADER.length);
    bis.read(amrData, AMR_MAGIC_HEADER.length, rawAmrDataLength);
    return amrData;
}

另请注意,AMR-WB的准确度略低,因此您可能需要考虑使用更详细的API而不是代号的原始音频捕获。