使用Amazon的avs SDK for Alexa解析音频文件

时间:2016-07-30 06:28:05

标签: java alexa-voice-service

一般情况下,我想使用亚马逊的avs sdk为Alexa解析音频文件而不仅仅是麦克风录音。

使用OSX 10.11.6。

首先,我从https://developer.amazon.com/public/solutions/alexa/alexa-voice-service/docs/java-client-sample

下载了Alexa Voice Service Sample App

然后我配置并执行了companionService(nodejs),然后是java客户端,它工作正常..我说麦克风上的东西,Alexa响应。现在我想添加一种加载声音的功能,并从计算机而不仅仅是麦克风上播放声音。

首先,我创建了一个向UI添加按钮的功能。 所以我编辑了samples/javaclient/src/main/java/com/amazon/alexa/avs/AVSApp.java。我复制了添加“开始聆听”按钮并对其进行修改的功能:

private void addBrowseField() {
    final RecordingRMSListener rmsListener = this;
    browseButton = new JButton(BROWSE_LABEL);
    browseButton.setEnabled(true);
    browseButton.addActionListener(new ActionListener() {
        @Override
        public void actionPerformed(ActionEvent e) {
            controller.onUserActivity();
            if (browseButton.getText().equals(BROWSE_LABEL)) { // if in idle mode
                browseButton.setText(BROWSE_STOP_LABEL);
                RequestListener requestListener = new RequestListener() {

                    @Override
                    public void onRequestSuccess() {
                        finishProcessing();
                    }

                    @Override
                    public void onRequestError(Throwable e) {
                        log.error("An error occured creating speech request", e);
                        JOptionPane.showMessageDialog(getContentPane(), e.getMessage(), "Error",
                                JOptionPane.ERROR_MESSAGE);
                        browseButton.doClick();
                        finishProcessing();
                    }
                };

                controller.startFileLoading("/Users/ufk/Desktop/eli3.raw", requestListener);
                // controller.stopRecording(); /// stop the recording so the request can complete
            } else {
                browseButton.setText(BROWSE_LABEL);
                controller.stopRecording();
            }
        }
    });
    getContentPane().add(browseButton);
}

然后我在私有AVSApp函数中添加了此函数的执行:

private AVSApp(DeviceConfig config) throws Exception {
...
        addBrowseField();
...
}

现在好了......在我的新addBrowseField()函数中,我正在调用我在控制器中创建的一个名为startFileRecording的新函数。 所以我修改了 samples/javaclient/src/main/java/com/amazon/alexa/avs/AVSController.java

startRecording函数复制到startFileLoading并修改它:

public void startFileLoading(String path,RequestListener requestListener) {

    try {
        InputStream in = (InputStream)new BufferedInputStream(new FileInputStream(new File(path)));
        String dialogRequestId = dialogRequestIdAuthority.createNewDialogRequestId();

        RequestBody body = RequestFactory.createSpeechRegonizerRecognizeRequest(dialogRequestId,
                PROFILE, FORMAT, player.getPlaybackState(), player.getSpeechState(),
                alertManager.getState(), player.getVolumeState());

        dependentQueue.clear();

        avsClient.sendEvent(body, in, requestListener, AUDIO_TYPE);

        speechRequestAudioPlayerPauseController.startSpeechRequest();

    } catch (Exception e) {
        player.playMp3FromResource(ERROR_SOUND);
        requestListener.onRequestError(e);
    }
}

现在您可以看到,我使用文件eli3.raw。我录制自己说一个命令(只有音频)并用ffmpeg -i eli.m4a -f s16le -ac 1 -acodec pcm_s16le eli3.raw

将其转换为LPCM

所以我点击实际加载Browse音频文件的新创建的eli3.raw按钮,几秒钟我点击Stop Browse按钮,没有任何实际发生。

我没有java错误,也没有任何警告。

我对所有avs sdk都很陌生,所以我可能做错了什么......不知道是什么。

1 个答案:

答案 0 :(得分:0)

好..所以音频文件的格式错误。使用带有这些标志的ffmpeg:ffmpeg -i eli.m4a -acodec pcm_s16le -ac 1 -ar 16000 eli.wav解决了这个问题。