尝试在“<span class =”s-name“> </span>之间的网站上获取名称列表

时间:2017-08-30 02:51:26

标签: curl awk grep cat

cat file | grep "<span class='s-name'>" | awk '/"<span class='s-name'>"/ && /</span>

关于这一点似乎是错误的。我的意思是,除了它不起作用。

我也想把它放到一个文件中,我很确定最后只是'文件名'。

2 个答案:

答案 0 :(得分:0)

使用 GNU grep

<强> 输入

$ cat infile
<div class='signer'> <span class='s-name'>Bob Lepine</span> <span class='s-title'>Vice President of Content, FamilyLife</span> </div>

<强> 输出

$ grep -Po "(?<=<span class='s-name'>).*?(?=</span>)" infile
Bob Lepine

$ grep -Po "(?<=<span class='s-title'>).*?(?=</span>)" infile
Vice President of Content, FamilyLife

答案 1 :(得分:0)

使用xml / html解析器是解析xml / html内容的正确方法,xmlstarlet解决方案:

xmlstarlet sel -t -v "//span[@class='s-name']" yourfile

输出:

Bob Lepine