使用谷歌语音API,issu与音频文件格式

时间:2017-03-10 07:22:00

标签: audio google-speech-api flac

希望你一切顺利,

我尝试使用谷歌语音API将我直接提交的采访转换为文本文件。

我试图让环境正常运行,所以我用文件测试它: 我对音频非常陌生,所以我使用在线转换器将测试文件转换为FLAC:http://www.online-convert.com/ 然后,我使用ffprobe来验证,它对我来说很好,

Input #0, flac, from '../../Walk_Away.flac':
Metadata:
    MAJOR_BRAND     : mp42
    MINOR_VERSION   : 0
    COMPATIBLE_BRANDS: isommp42
    ARTIST          : Aaron Michael Cox
    TITLE           : Walk Away
    ENCODER         : Lavf57.57.100
  Duration: 00:03:12.08, start: 0.000000, bitrate: 185 kb/s
    Stream #0:0: Audio: flac, 16000 Hz, mono, s16
[FORMAT]
filename=../../Walk_Away.flac
nb_streams=1
nb_programs=0
format_name=flac
format_long_name=raw FLAC
start_time=0.000000
duration=192.078375
size=4444256
bit_rate=185101
probe_score=50
TAG:MAJOR_BRAND=mp42
TAG:MINOR_VERSION=0
TAG:COMPATIBLE_BRANDS=isommp42
TAG:ARTIST=Aaron Michael Cox
TAG:TITLE=Walk Away
TAG:ENCODER=Lavf57.57.100
[/FORMAT]

但是,当我尝试:

node recognize.js async-gcs gs://file.flac -e LINEAR16 -r 16000

我收到一个非常悲伤的结果:"转录:,,"

有人能帮帮我吗?非常感谢 伊万

1 个答案:

答案 0 :(得分:0)

问题是该文件是FLAC文件,但在命令中您已指定它是原始音频文件(LINEAR16)。再试一次,但指定它是带有选项-e FLAC的FLAC文件,看看是否有帮助。所以命令看起来应该是这样的:

node recognize.js async-gcs gs://file.flac -e FLAC -r 16000

或者,您可以将音频文件转换为原始音频文件。