使用bash从html表的特定列中提取值

时间:2014-11-25 12:58:38

标签: html bash awk sed

我有一个html表,其中第一行是标题,下一行表示表的主体。我想从每行的3< rd列中提取值。我该怎么办?

1 个答案:

答案 0 :(得分:0)

尝试以下awk命令,

awk 'NR>1{print $3}' file

这将打印第三列的值,但标题中的值除外。

更新

awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file