我正在使用socket.io从每个音频通道发送原始PCM数据,如下所示:
this.streamNode.onaudioprocess = (e) => {
const leftChan = e.inputBuffer.getChannelData(0);
const rightChan = e.inputBuffer.getChannelData(1);
socket.emit('stream_rx_channel1', convertFloat32ToInt16(leftChan));
socket.emit('stream_rx_channel2', convertFloat32ToInt16(rightChan));
};
我正在使用带有ScriptProcessorNode的Web Audio API来捕获每个通道的PCM数据,并将左右声道的数据分别发送到NodeJs服务器。
但是,我需要知道一种在NodeJ中将流合并回去以创建立体声音频流的方法,该方法可以发送到Google的语音转文本服务。 Google会针对音频流(check here)中的每个频道自动进行转录。我需要这个,因为此音频流中的左右声道是2种不同的声音。
我正在使用Google的stream recognize进行语音实时转录以进行文本转录。