尝试使用curl和sed从网页中提取MRTG信息

时间:2013-05-21 01:17:36

标签: html curl sed extract

我正在尝试从MRTG页面中提取一些信息进行跟踪,即5分钟图表中“5英寸”的“最大值”,“平均值”和“曲线”值。

到目前为止,我已经提出了

curl -s http://xxx.com/1.2.3.4.html | sed -n '/Begin `Daily/,/End `Daily/p' | sed -n '/>In/\<\/tr/p'

让我这个

                                       <th scope="row">In</th>
                                    <td>2291.2 kb/s (2.3%)</td>
                                    <td>439.3 kb/s (0.4%) </td>
                                    <td>141.3 kb/s (0.1%) </td>
                            </tr>                        

现在,我需要在类“in”中提取3个数字kb / s值,如果可能,用空格分隔。

我该怎么做?

谢谢!

1 个答案:

答案 0 :(得分:0)

尝试:

... | grep -Po '[\d.]+(?= kb)' | perl -l40pe0