在Python中将数据文件列拆分为单独的数组

时间:2012-02-27 03:17:16

标签: python

我是python的新手,并且一直试图弄清楚这一点。我有一个数据文件,如下所示,

time    I(R_stkb)

Step Information: Temp=0  (Run: 1/11)

0.000000000000000e+000  0.000000e+000

9.999999960041972e-012  8.924141e-012

1.999999992008394e-011  9.623148e-012

3.999999984016789e-011  6.154220e-012

(注意:每条数据线之间没有空行。)

我想使用matplotlib函数绘制数据,所以我需要在数组中使用两个单独的列。

我目前有

def plotdata():

Xvals=[], Yvals=[]
i = open(file,'r')

for line in i:
    Xvals,Yvals = line.split(' ', 1)

print Xvals,Yvals

但显然它完全错了。任何人都可以给我一个简单的答案,并解释这些线的确切含义会有所帮助。欢呼声。

编辑:前两行在整个文件中重复。

4 个答案:

答案 0 :(得分:5)

这是*方法zip运算符的作业。

>>> asdf
[[1, 2], [3, 4], [5, 6]]


>>> zip(*asdf)
[(1, 3, 5), (2, 4, 6)]

因此,在您的数据环境中,它可能类似于:

handle = open(file,'r')
lines = [line.split() for line in handle if line[:4] not in ('time', 'Step')]
Xvals, Yvals = zip(*lines)

或者如果你真的需要能够在之后改变数据,你可以在每个元组上调用list构造函数:

Xvals, Yvals = [list(block) for block in zip(*lines)]

答案 1 :(得分:2)

一种方法是:

Xvals=[]; Yvals=[]
i = open(file,'r')

for line in i:
    x, y = line.split(' ', 1)
    Xvals.append(float(x))
    Yvals.append(float(y))

print Xvals,Yvals

请注意对float函数的调用,该函数会将您从文件中获得的字符串更改为数字。

答案 2 :(得分:1)

这是numpy.loadtxt的目的。尝试:

import numpy as np
import matplotlib.pyplot as plt

data = np.loadtxt(file, skiprows = 2) # assuming you have time and step information on 2 separate lines 
                                      # and you do not want to read them
plt.plot(data[:,0], data[:,1])
plt.show()

编辑: 如果你有时间和步骤信息分散在整个文件中,你想在每一步上绘制数据,有可能将所有文件读取到内存(假设它足够小),然后将其拆分为time个字符串:

l = open(fname, 'rb').read()
for chunk in l.split('time'):
    data = np.array([s.split() for s in chunk.split('\n')[2:]][:-1], dtype = np.float)
    plt.plot(data[:,0], data[:,1])
    plt.show()

或者您可以将#评论标记添加到评论行并使用np.loadxt

答案 3 :(得分:0)

如果要使用matplotlib绘制此文件,可能需要查看它的plotfile函数。请参阅官方文档here