在python中过滤HTML表数据

时间:2016-12-07 23:23:37

标签: python html

我有一个包含多行的HTML表格。我想通过插入过滤条件来实现过滤表数据的可能性。这必须在python的服务器端完成。我需要避免使用BeautifulSoup。由于我的表格已经简化,我希望仅使用正则表达式实现此目的。

基本上,一旦用户点击表格页面上的按钮,脚本只应显示匹配的表格行。

表是:

<tr>
    <td valign="top">test67</td> //username
    <td valign="top">24-11-2016, 02:20</td> //date
    <td valign="top">1</td> //number
    <td valign="top">0</td> // number
    <td valign="top">Player win</td> // result
    <td valign="top">1</td> // time
</tr>

Python方面:

#!/usr/bin/python
import re
import cgi
data = cgi.FieldStorage()
filter = data.getvalue('request')
f = open('..../stats.html', 'r+')
html = f.read()
matches = re.findall(filter, html)
f.write(matches)
f.close()

这是我到目前为止的版本,它不解析一个东西。我知道它目前是错误的,因为write只会插入完全匹配,但是请您指出为什么它根本不插入任何内容,如果有可能定义findall将搜索匹配的空白,也可以提供帮助?

0 个答案:

没有答案