我正在Web浏览器中录制音频并将其发送到Flask后端。从那里,我想使用Watson Speech to Text转录音频。我无法确定我接收音频的数据格式以及如何将其转换为适用于Watson的格式。
我相信watson期望像b'\ x0c \ xff \ x0c \ xffd这样的字节串。我从浏览器接收的数据看起来像[-4 -27 -34 -9 1 -8 -1 2 10 -28],由于负值,我无法直接将其转换为字节(使用bytes()给我该错误)。
我真的不知所措,我需要在这里进行哪种转换。 Watson不会为我抛出的任何类型的数据返回任何错误,只是没有响应。
答案 0 :(得分:0)
这些值应该没问题,但是在获取它们的字节表示形式之前,必须定义如何存储它们。
您只想将这些值转换为带符号的2字节/ 16位整数,然后获取这些值的字节表示形式。