我有包含信息的html文件
<li>
<a title="Title_01" href="http://mysite.ru/test/portal/doc/#number=ABC01" target="_blank"><span class="i">ABC01 01/02 </span>(2006.01)</a>
</li>
<li>
<a title="Title_02" href="http://mysite.ru/test/portal/doc/#number=ABC02" target="_blank"><span class="i">ABC02 02/02 </span>(2006.01)</a>
</li>
<p>(73) Name(test):<b>
<br>MY TEST ORGANIZATION (TT)</b>
</p>
我可以使用grep命令解析数据,然后将数据手动连接到Excel
grep "number=" *.html > tt.txt
但是有什么方法可以用grep做到这一点,我会将结果保存到这样的csv文件中
MY TEST ORGANIZATION, ABC01
MY TEST ORGANIZATION, ABC02
答案 0 :(得分:1)
好吧,我们可以使用awk做得更好,但是,如果您需要快速的答案,那么可以这样做:
grep "number=" file | sed 's/number=/MY TEST ORGANIZATION, /g;s/"//g' | cut -d# -f2
结果:
MY TEST ORGANIZATION, ABC01
MY TEST ORGANIZATION, ABC02
答案 1 :(得分:1)
awk -F“ [> | \” | =]“'/ number = / {打印”我的测试组织,“ $ 7}”文件
我的测试组织,ABC01
我的测试组织,ABC02
awk可以这样做!