我正在尝试使用tf.audio.decode_wav
将一些音频文件拉入Tensorflow。
我可以看到有人正在寻找在文档中提供更多信息的方法,但是没有人有任何示例说明该如何工作吗?
tf.audio.decode_wav(
contents,
desired_channels=-1,
desired_samples=-1,
name=None
)
Args:
我猜测内容是已经从文件而非路径中拉出的张量?
答案 0 :(得分:5)
您是对的,tf.audio.decode_wav()
需要张量。您可以提供一个
tf.io.read_file()
会将wav文件读取为字符串类型的张量。
raw_audio = tf.io.read_file(filename)
waveform = tf.audio.decode_wav(raw_audio)