希望你一切顺利,
我尝试使用谷歌语音API将我直接提交的采访转换为文本文件。
我试图让环境正常运行,所以我用文件测试它: 我对音频非常陌生,所以我使用在线转换器将测试文件转换为FLAC:http://www.online-convert.com/ 然后,我使用ffprobe来验证,它对我来说很好,
Input #0, flac, from '../../Walk_Away.flac':
Metadata:
MAJOR_BRAND : mp42
MINOR_VERSION : 0
COMPATIBLE_BRANDS: isommp42
ARTIST : Aaron Michael Cox
TITLE : Walk Away
ENCODER : Lavf57.57.100
Duration: 00:03:12.08, start: 0.000000, bitrate: 185 kb/s
Stream #0:0: Audio: flac, 16000 Hz, mono, s16
[FORMAT]
filename=../../Walk_Away.flac
nb_streams=1
nb_programs=0
format_name=flac
format_long_name=raw FLAC
start_time=0.000000
duration=192.078375
size=4444256
bit_rate=185101
probe_score=50
TAG:MAJOR_BRAND=mp42
TAG:MINOR_VERSION=0
TAG:COMPATIBLE_BRANDS=isommp42
TAG:ARTIST=Aaron Michael Cox
TAG:TITLE=Walk Away
TAG:ENCODER=Lavf57.57.100
[/FORMAT]
但是,当我尝试:
时 node recognize.js async-gcs gs://file.flac -e LINEAR16 -r 16000
我收到一个非常悲伤的结果:"转录:,,"
有人能帮帮我吗?非常感谢 伊万
答案 0 :(得分:0)
问题是该文件是FLAC文件,但在命令中您已指定它是原始音频文件(LINEAR16
)。再试一次,但指定它是带有选项-e FLAC
的FLAC文件,看看是否有帮助。所以命令看起来应该是这样的:
node recognize.js async-gcs gs://file.flac -e FLAC -r 16000
或者,您可以将音频文件转换为原始音频文件。