我被要求在UNIX中编写一个脚本代码,用于从HTML页面中的表中获取值 并在控制台中显示它,但只是取表格第一列的值。
或者将整个代码放在变量中并编写一个脚本,使其从第一列开始。
以下是一个示例:
<html>
<body>
<table border="1" bordercolor="#FFCC00" style="background-color:#FFFFCC" width="100%" cellpadding="3" cellspacing="3">
<tr align="center">
<th>Environment</th><th>Release Track</th><th>Artifact</th><th>Name</th><th>Build #</th><th>Cert Idn</th><th>Build Idn</th><th>Request Status</th><th>Update Time</th><th>Log Info.</th><th>Initiator</th>
</tr>
<tr>
<td>DEV03</td><td>2.1.0</td><td>abpa</td><td>ecom-abpa-ear</td><td>204</td><td>82113</td><td>171242</td><td>Deployed</td><td>3/18/2013 3:10:58 PM</td><td width="70">Log info</a></td><td>CESAR</td>
</tr>
<tr>
<td>DEV03</td><td>2.1.0</td><td>abpa</td><td>abpa_dynamic_config_properties</td><td>20</td><td>82113</td><td>167598</td><td>Deployed</td><td>3/18/2013 2:32:27 PM</td><td width="70">Log info</a></td><td>CESAR</td>
</tr>
</table>
</body>
</html>
有谁知道如何继续?
答案 0 :(得分:0)
您的问题属于初级级别,因此答案也将是初级级别:
cat abc.html | awk -F“”'{print $ 1}'
答案 1 :(得分:0)
试试这个oneliner,它将从HTML表中打印第一列:
grep -E "\<th\>|\<td\>" abc.html | awk -F "<th>|<td>" '{print $2}' | sed 's/<[^>]\+>/ /g'
文件abc.html中的是你的html代码。输出在这里:
system:/depot/scripts/sh # grep -Ew "\<th\>|\<td\>" abc.html | awk -F "<th>|<td>" '{print $2}' | sed 's/<[^>]\+>/ /g'
Environment
DEV03
DEV03
system:/depot/scripts/sh #