我的局域网中有一个html页面。我需要每1秒获取一些数字并将其保存在数据库中。 最好的方法是什么?
我认为解析器可能是使用python编写的。但是该脚本如何不断解析。也许使用cron?
答案 0 :(得分:0)
由于您正在监视似乎是一个自动HTML页的页面,该页面的更改频率通常为1 / sec,因此您可以避免使用正则表达式提取数据。 (SO中有很多关于使用正则表达式解析HTML的警告,但这可能是例外情况之一,因为它似乎是一个自动化页面,也许是某种形式的工厂传感器自动化或股票行情自动收录器。自动化页面通常保持一致格式,因此使用正则表达式提取特定字段可能就可以了。)
关于运行解析器1 /秒,您可以在Python脚本本身中执行此操作,只需在time.sleep
永久循环内使用像while True
这样的简单操作即可。