标签: parsing flv web-crawler nutch
我的要求是从flv文件中提取文本和音频。请建议我如何使用任何网络爬虫实现这一目标。如果无法使用网络抓取工具,请向我推荐任何其他工具。
三江源
答案 0 :(得分:0)
使用Nutch,您可以从FLV文件中解析和提取元数据。 如果文本已作为元数据的一部分添加到文件中,则可以使用Nutch将其检索并将其放入数据库中。
但你可能应该看看wget(下载内容)+“FLV流提取工具”的组合,以实现你所需要的。
Nutch
Wget
FLV metadata