标签: html bash awk sed
我有一个html表,其中第一行是标题,下一行表示表的主体。我想从每行的3< rd列中提取值。我该怎么办?
答案 0 :(得分:0)
尝试以下awk命令,
awk 'NR>1{print $3}' file
这将打印第三列的值,但标题中的值除外。
更新
awk -v RS='</tr>' -v F='<td>' '{$3=gsub(/<[^<>]*>/,"",$3);print $3}' file