在不断更新文本文件中解析新数据

时间:2017-08-23 07:51:55

标签: python python-2.7 data-analysis readlines real-time-data

我想实时分析一个临时文件(扩展名为.txt)。临时文件的格式为:

  

6000 -64.367700E + 0 19.035500E-3
  8000 -64.367700E + 0 18.989700E-3

然而,在导入&打印它不是我希望的矩阵,但实际上有格式:

  

'6000 \叔64.367700E + 0 \ t19.035500E-3 \ N8000 \叔64.367700E + 0 \ t18.989700E-3'

我尝试逐行导入,但由于它是字符串格式,因此我无法使用xreadlines()readlines()。我可以拆分字符串,然后将数据分成适当的列表进行分析,但有没有建议只处理新数据。随着文件变大,它将减慢代码的速度以定期重新处理所有数据,我无法弄清楚如何复制xreadlines()循环。

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

你试过这个吗?

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

您可以指定分隔符\ t。