Question

我有一个python脚本，它使用mechanize从网页中获取数据。这工作正常，但我已经做了一个黑客工作，然后使用bash过滤我正在寻找的文本。我现在需要在主python脚本中执行此操作，因为我需要使用输出值。

response = br.submit()
print response.read()

这打印出我随后用bash操作的响应

| grep usedData | cut -d '"' -f2 | sed 's/\<GB used\>//g'`

我怎样才能在python中完成这一切？

bash脚本的输出是一个数字（例如123.45）

输入：

<tr><th>Current Data Usage:  </th><td>221.59GB</td></tr>


Output: 221.59

Answer 1

您可以使用正则表达式查找＆＃34; GB＆＃34;之前的所有数字和句点序列。

lis=['dog',['small','medium','large],'duck',['small','medium','large']]

Answer 2

只需尝试：

input_html = "<tr><th>Current Data Usage:  </th><td>221.59GB</td></tr>"
begin = input_html.find("</th><td>")
end = input_html.find("GB</td>")
output = input_html[begin+len("</th><td>"):end]
print output

这应该找到你正在寻找的东西。

在python中过滤输出？

2 个答案: