教程tensorflow音频音高分析

时间:2018-08-09 18:39:37

标签: python-3.x tensorflow audio analysis pitch

我是使用tensorflow和Python的初学者,我正在尝试构建一个应用程序,该应用程序可以在足球(足球)中自动检测到某些关键时刻(黄/红牌,进球等)。

我开始了解如何进行视频分析,以我自己建立的数据集对程序进行培训,然后从网络上下载图像并对其进行标记。为了获得更好的分析结果,我想知道是否有人对教程提出了一些建议,以便了解如何在音频文件上训练我的应用程序,从而使程序能够了解音高变化的情况。在视频的音频中结合视频和音频分析,以获得更好的结果。

提前谢谢

1 个答案:

答案 0 :(得分:0)

由于您是Python和tensorflow的新手,所以我建议您暂时仅关注音频,尤其是因为它是足球比赛中重要事件的有力指标(红/黄牌,令人讨厌的犯规,进球,机会很大) ,好戏等)。

非常简单,根本不需要使用太多的ML,您可以使用一个时间段的平均数量来推断重要性。如果您想稍微复杂一点,可以考虑使用语音转文本库在评论员语音中查找关键字。

使用视频来确定何时发生重要事件要困难得多。

此页面可以帮助您开始使用Python进行音频信号处理。

https://bastibe.de/2012-11-02-real-time-signal-processing-in-python.html