从网站

时间:2015-09-14 20:16:19

标签: html web xidel

我正在尝试使用Windows命令行和工具从网页中找到特定链接。我认为Xidel可以做我想做的事。 在页面中,链接使用如下:

file: 'http://link.link/index.txt'

注意:这样只有一行。现在,如果我可以设置像

这样的东西
  

档案:'{%link}'

然后我将能够提取链接。另外,如果我想将index.txt这个词更改为root.txt之类的内容,然后使用aria2将链接下载为http://link.link/root.txt,我还需要做什么?

(我对任何这些工具/命令都没有任何经验,比如脚本,我只是想做一些这样的事情(有些替代方案已经可用,但我想自己做)而且这只是这个。所以我我找到了它并且知道我该怎么做但是提取确切的网址似乎是最困难的部分,因为我找不到任何可以帮助我在xidel的文档中的内容)

1 个答案:

答案 0 :(得分:0)

Xidel旨在从HTML / XML / json文件中提取数据,但如果您知道如何使用$ raw变量和xidel / xquery函数(如extract(),tokenize()),它也可以从CSV和TXT中提取并替换()。

发布网页的网址或来源(或部分内容),我会看到我如何为您提供帮助。