如何使用AIFF文件获取语音转文本

时间:2020-02-13 14:15:13

标签: javascript google-cloud-speech

我正在尝试通过Google语音转文本框架发送AIFF base64,但是它似乎仅适用于WAV文件。 该API告诉我,我需要将AudioEncoding设置为特定类型,但是我不确定哪种可以与AIFF一起使用。我还需要设置sampleHertzRate,我不确定如何使用Javascript进行检索。有人可以帮忙吗?

这是我的POST正文:

{
    "config": {
        "encoding": "LINEAR16",
        "audioChannelCount": 1,
        "sampleRateHertz": 8000,
        "languageCode": "en-US",
        "profanityFilter": "true",
        "speechContexts": [],
        "enableAutomaticPunctuation": true,
        "metadata": {
            "interactionType": "VOICE_COMMAND",
            "microphoneDistance": "NEARFIELD",
            "originalMediaType": "AUDIO",
            "recordingDeviceType": "SMARTPHONE",
            "recordingDeviceName": "iPhone"
        },
        "model": "command_and_search"
    },
    "audio": {
        "content": "$base64Audio"
    }
}

1 个答案:

答案 0 :(得分:0)

API告诉我,我需要将AudioEncoding设置为 特定类型

也许您遇到“数据URI问题” mdn MIME_types,并且需要将数据:MIME类型附加到文件中?像这样:

let base64AudioUrl = `data:audio/x-aiff; base64,${$base64Audio}`;

在Wikipedia上,它们为AIFF定义了两种MIME类型: “音频/ x-aiff”和“音频/ aiff”

如果您从表单中发布数据,可能需要添加enctype:

<form method="post" enctype="multipart/form-data">