我目前正在使用Google的语音API,我想知道我可以编辑我输入到程序中的FLAC文件的长度。例如我有一个长度为7:30的mp3和2个音频通道,我需要它是1通道单声道FLAC文件,长度为3分钟,可以输入到语音到文本API。
答案 0 :(得分:1)
标题是否必须在Python中完成?如果可以在命令行上进行转换,则可以使用for col in df:
print (df[col].apply(type))
0 <class 'str'>
1 <class 'int'>
2 <class 'int'>
3 <class 'str'>
Name: mixed, dtype: object
#python 3 - string
#python 2 - basestring
mask = df['mixed'].apply(lambda x: isinstance(x,str))
print (mask)
0 True
1 False
2 False
3 True
Name: mixed, dtype: bool
df = df[mask]
print (df)
mixed
0 3
3 2
之类的工具。例如:
sox
sox audio.flac audio-short-mono.flac trim 0 180 remix 1,2
选项将音频裁剪为180秒,trim 0 180
将两个频道合并为一个。