正则表达式不与Grep合作

时间:2014-02-04 16:42:46

标签: regex bash grep wget

我试图打印html表格单元格的内容。

我认为最简单的方法是使用grep, 但出于某种原因,正则表达式适用于regexr.com但不适用于Grep。

也许是逃避的东西?我试图逃避小于和大于<>符号。

这是我正在使用的代码

wget -q -O login.html --save-cookies cookies.txt --keep-session-cookies --post-data 'username=sssss&password=fffff' http://ffffff/login

wget -q -O page.html --load-cookies cookies.txt http://ffffff/somepage |grep -P '(?<=<tr><td class=list2>www</td><td class=list2 align=center>A</td><td class=list2 >)(.*?)(?=</td><td class=list2 align=center><input type=checkbox name=arecs5)' |recode html...ascii 
是的,有人可以帮帮我吗?我来自荷兰,很抱歉我的英语。

我也尝试添加-c选项并打印0

编辑:

添加了我的完整代码,我发现了1个错误。我没有-O参数来输出页面的html。但它仍然无法正常工作。什么都不打印

3 个答案:

答案 0 :(得分:1)

传统grep不支持您使用它的方式。

尝试使用grep -P (PCRE)

grep -P 'pattern' file

答案 1 :(得分:0)

考虑使用支持原生PCRE的Ackag

答案 2 :(得分:0)

最后,它有效。 我添加了-qO-给wget,我不知道为什么但是在添加一个 - 在-O之后它可以工作。