标签: python audio machine-learning audacity aubio
是否可以获得音频文件中每个单词的大致持续时间?最接近的事情(对于来自YouTube视频的音频文件)是将标题文件下载为srt。然后,srt将为视频中的每个句子设置持续时间。
srt
我想知道是否有可能以某种方式获得句子中每个单词的持续时间。也许不准确,但周围有什么?