在python中过滤输出?

时间:2015-09-01 12:17:11

标签: python

我有一个python脚本,它使用mechanize从网页中获取数据。这工作正常,但我已经做了一个黑客工作,然后使用bash过滤我正在寻找的文本。我现在需要在主python脚本中执行此操作,因为我需要使用输出值。

response = br.submit()
print response.read()

这打印出我随后用bash操作的响应

| grep usedData | cut -d '"' -f2 | sed 's/\<GB used\>//g'`

我怎样才能在python中完成这一切?

bash脚本的输出是一个数字(例如123.45)

输入:

<tr><th>Current Data Usage:  </th><td>221.59GB</td></tr>


Output: 221.59

2 个答案:

答案 0 :(得分:1)

您可以使用正则表达式查找&#34; GB&#34;之前的所有数字和句点序列。

lis=['dog',['small','medium','large],'duck',['small','medium','large']]

答案 1 :(得分:0)

只需尝试:

input_html = "<tr><th>Current Data Usage:  </th><td>221.59GB</td></tr>"
begin = input_html.find("</th><td>")
end = input_html.find("GB</td>")
output = input_html[begin+len("</th><td>"):end]
print output

这应该找到你正在寻找的东西。