XIDEL将从多个HTML文件中提取的数据(div)导出到新的HTML文件中

时间:2016-12-19 08:26:08

标签: html xidel

我想废弃一个多页网站并提取一个特定的div,然后将其导出到只有div作为内容的html页面。

我可以使用Xidel通过以下命令从内容中提取数据

xidel http://someURl/ --extract //div[2]/div[2]/div -f "//a" -e //div[2]/div[2]/div

是否可以将提取的数据下载到html文件中?

1 个答案:

答案 0 :(得分:1)

添加参数: - output-format = html