我试图打印html表格单元格的内容。
我认为最简单的方法是使用grep, 但出于某种原因,正则表达式适用于regexr.com但不适用于Grep。
也许是逃避的东西?我试图逃避小于和大于<>符号。
这是我正在使用的代码
wget -q -O login.html --save-cookies cookies.txt --keep-session-cookies --post-data 'username=sssss&password=fffff' http://ffffff/login
wget -q -O page.html --load-cookies cookies.txt http://ffffff/somepage |grep -P '(?<=<tr><td class=list2>www</td><td class=list2 align=center>A</td><td class=list2 >)(.*?)(?=</td><td class=list2 align=center><input type=checkbox name=arecs5)' |recode html...ascii
是的,有人可以帮帮我吗?我来自荷兰,很抱歉我的英语。
我也尝试添加-c选项并打印0
编辑:
添加了我的完整代码,我发现了1个错误。我没有-O参数来输出页面的html。但它仍然无法正常工作。什么都不打印