Question

我正在尝试使用tf.audio.decode_wav将一些音频文件拉入Tensorflow。

我可以看到有人正在寻找在文档中提供更多信息的方法，但是没有人有任何示例说明该如何工作吗？

tf.audio.decode_wav(
 contents,
 desired_channels=-1,
 desired_samples=-1,
 name=None
)

Args：

我猜测内容是已经从文件而非路径中拉出的张量？

Answer 1

您是对的，tf.audio.decode_wav()需要张量。您可以提供一个 tf.io.read_file()会将wav文件读取为字符串类型的张量。

raw_audio = tf.io.read_file(filename)
waveform = tf.audio.decode_wav(raw_audio)