我从某个网站抓取(提取)数据。数据包含我需要的两个值,即(网格)频率值和时间。
网站上的数据每秒都在更新。我想继续使用python将这些值(附加它们)保存到列表或元组中。为此,我尝试使用 schedule 库。以下作业计划命令每秒运行数据抓取功能(socket_freq)。
import schedule
schedule.every(1).seconds.do(socket_freq)
while True:
schedule.run_pending()
我面临两个问题:
出:
(['19:27:02','19:27:02','19:27:02','19:27:03','19:27:03','19:27:03','19:27:03','19:27:03','19:27:03','19:27:03','19:27:04','19:27:04','19:27:04', ...],
['50.020','50.020','50.020','50.018','50.018','50.018','50.018','50.018','50.018','50.018','50.017','50.017','50.017'...])
如您所见,虽然我使用了每1秒运行一次的计划,但多次输入(追加)时间变量。我实际上希望检索的是:
出:
(['19:27:02','19:27:03','19:27:04'],['50.020','50.018','50.017'])
有人知道如何解决这些问题吗?
谢谢!
(我使用的是python 2.7.9)
答案 0 :(得分:1)
好的,这就是我要解决这些问题的方法:
检查下面的示例:
opam show -f package,version $(opam list -a -s) \
| sed -e '/ *package:/N; s/ *package: \([^\n]*\)\n *version: \([^\n]*\)/\1: \2/'
欢迎所有重构