我有一个python脚本,它使用mechanize从网页中获取数据。这工作正常,但我已经做了一个黑客工作,然后使用bash过滤我正在寻找的文本。我现在需要在主python脚本中执行此操作,因为我需要使用输出值。
response = br.submit()
print response.read()
这打印出我随后用bash操作的响应
| grep usedData | cut -d '"' -f2 | sed 's/\<GB used\>//g'`
我怎样才能在python中完成这一切?
bash脚本的输出是一个数字(例如123.45)
输入:
<tr><th>Current Data Usage: </th><td>221.59GB</td></tr>
Output: 221.59
答案 0 :(得分:1)
您可以使用正则表达式查找&#34; GB&#34;之前的所有数字和句点序列。
lis=['dog',['small','medium','large],'duck',['small','medium','large']]
答案 1 :(得分:0)
只需尝试:
input_html = "<tr><th>Current Data Usage: </th><td>221.59GB</td></tr>"
begin = input_html.find("</th><td>")
end = input_html.find("GB</td>")
output = input_html[begin+len("</th><td>"):end]
print output
这应该找到你正在寻找的东西。