应用错误收集

创建连续html解析的最佳方法是什么？

时间：2018-10-14 05:20:38

标签： python parsing cron

我的局域网中有一个html页面。我需要每1秒获取一些数字并将其保存在数据库中。最好的方法是什么？

我认为解析器可能是使用python编写的。但是该脚本如何不断解析。也许使用cron？

1 个答案:

答案 0 :(得分：0)

由于您正在监视似乎是一个自动HTML页的页面，该页面的更改频率通常为1 / sec，因此您可以避免使用正则表达式提取数据。（SO中有很多关于使用正则表达式解析HTML的警告，但这可能是例外情况之一，因为它似乎是一个自动化页面，也许是某种形式的工厂传感器自动化或股票行情自动收录器。自动化页面通常保持一致格式，因此使用正则表达式提取特定字段可能就可以了。）

关于运行解析器1 /秒，您可以在Python脚本本身中执行此操作，只需在time.sleep永久循环内使用像while True这样的简单操作即可。