尾部读取不断增长的动态文件并提取两列,然后打印图形

时间:2009-11-11 00:42:51

标签: python graph tail matplotlib

读取1 GB文件的最佳方法是什么,该文件会记录时间序列数据,并生成包含两列(一次和另一个数字)的实时图表?我看到你有不同的方法来拖尾文件。

3 个答案:

答案 0 :(得分:7)

RRDTool听起来不错。

但是如果你想坚持使用Python,我会使用tail将数据流式传输到我的程序中(这假设文件是​​连续写入的,否则Python中的直接打开()将起作用。)

tail -F data.log | python myprogram.py

myprogram.py看起来像:

import sys

p = ... # create a pylab plot instance 
for line in sys.stdin:
    elements = line.split(',') # or whatever separator your file has in it
    p.add(element[0], element[1]) # add data to the pylab plot instance

答案 1 :(得分:2)

正如约翰所提到的,你可以将尾部输出输入到你的文件中,但是如果你由于某种原因想要处理文件中的所有内容并且想要一个有点动态图的例子,那么它就是

import math
import time
import pylab  

def getDataTest(filePath):
    s = 0
    inc = .05
    x_list=pylab.arange(0, 5.0, 0.01)
    while 1:
        s += inc
        if abs(s) > 1:
            inc=-inc

        y_list = []
        for x in x_list:
            x += s
            y = math.cos(2*math.pi*x) * math.exp(-x)
            y_list.append(y)

        yield x_list, y_list

def tailGen(filePath):
    f = open(filePath)
    #f.seek(0, 2) # go to end
    for line in f: yield line
    while 1:
        where = f.tell()
        line = f.readline()
        if line:
            yield line
        else:
            time.sleep(.1)
            f.seek(where)

def getData(filePath):
    x_list = []
    y_list = []
    maxCount = 10
    for line in tailGen(filePath):
        # get required columns
        tokens = line.split(",")
        if len(tokens) != 2:
            continue
        x, y = tokens
        x_list.append(x)
        y_list.append(y)
        if len(x_list) > maxCount:
            x_list = x_list[-maxCount:]
            y_list = x_list[-maxCount:]
            yield x_list, y_list

pylab.ion()
pylab.xlabel("X")
pylab.ylabel("Y")

dataGen = getData("plot.txt") # getDataTest("plot.txt") #
x_list, y_list = dataGen.next()
plotData, = pylab.plot(x_list, y_list, 'b')
#pylab.show()
pylab.draw()
for (x_list, y_list) in dataGen:
    time.sleep(.1)
    plotData, = pylab.plot(x_list, y_list, 'b')
    pylab.draw()

你可以从中拾取元素,我认为它可以解决你的问题。

答案 2 :(得分:1)

这里的unix管道有3个部分:尾部,过滤器(gawk)和绘图仪(python)。

tail -f yourfile.log | gawk '/PCM1/{print $21; fflush();}' | python -u tailplot.py

这是python脚本。您可以为其提供1(y)或2(x y)列数据。如果您不使用gawk,请务必弄清楚如何禁用缓冲。例如sed -u

pa-poca$ cat ~/tailplot.py

import math
import time
import sys
import pylab

pylab.ion()
pylab.xlabel("X")
pylab.ylabel("Y")

x = []
y = []
counter = 1
while True :
    line = sys.stdin.readline()
    a = line.split()
    if len(a) == 2:
      x.append(a[0])
      y.append(a[1])
    elif len(a) == 1:
      x.append(counter)
      y.append(a[0])
      counter = counter + 1
    pylab.plot(x, y, 'b')
    pylab.draw()