如何使用任何网络爬虫从flv文件中提取内容?

时间:2013-05-14 09:31:24

标签: parsing flv web-crawler nutch

我的要求是从flv文件中提取文本和音频。请建议我如何使用任何网络爬虫实现这一目标。如果无法使用网络抓取工具,请向我推荐任何其他工具。

三江源

1 个答案:

答案 0 :(得分:0)

使用Nutch,您可以从FLV文件中解析和提取元数据。 如果文本已作为元数据的一部分添加到文件中,则可以使用Nutch将其检索并将其放入数据库中。

但你可能应该看看wget(下载内容)+“FLV流提取工具”的组合,以实现你所需要的。

Nutch

Wget

FLV metadata