我一直想知道有多少种不同的搜索技术,用于搜索文本,搜索图像甚至视频。
但是,我从未遇到过在音频文件中搜索内容的解决方案。
例如:让我们假设我有大约200个播客以mp3,wav和ogg文件的形式下载到我的电脑上。它们都被命名为podcast1.mp3,podcast2.mp3等等。因此,如果没有实际听到内容,就无法知道内容是什么。让我们说,我有兴趣发现,播客谈论“游戏编程”。我希望结果显示为:
所以我的问题:
我想到的一个想法是,人们可以使用“语音到文本”软件来获取每个音频文件的时间索引的成绩单,然后解析成绩单以获得输出。 / p>
我认为这是我的业余爱好项目之一。 谢谢!