我的Python代码没有从.csv excel文件中提取所有信息,我无法弄清楚原因

时间:2015-01-19 16:44:44

标签: python excel csv graph plot

我对编码场景很陌生,我的老板有点把我扔进火里,所以如果这是一个新手的错误,我很抱歉,虽然我认为不是。

所以我试图将G与l1(这不是十一,而是一个L1)进行对比。数据位于我从excel文件加载的文件中。 excel文件是14x250,因此有14个参数,每个参数有250个数据点。我提出的图表格式正确,但显示零y值。据我所知,代码正在绘制前12列,并留下最后2列(包含两组'y'数据)。我无法找到错误的位置,这让我发疯!非常感谢任何帮助!

这是我格式化excel文件的地方,我认为错误的地方是:

header = ['l1', 'l2', 'l3', 'l4', 'l5', 'EI',
      'S', 'P_right', 'P1_0', 'P3_0',
      'w_left', 'w_right', 'G_left', 'G_right']

def loadfile(filename, skip=[], *args):
    output = []
    with open(filename, *args) as f:
        reader = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        for i, row in enumerate(reader):
            if not(i in skip):
                output.append(row)
    return np.array(output)

这是我实际加载excel文件的地方,这是下一个可能存在错误的地方:

outputs_l1 = [loadfile('FILE.csv'.format(p)) for p in p3_arr]

fig = plt.figure()
for output, col in zip(outputs_l1, colors):
    plt.plot(output[:,0], output[:,10]*1E3, col+'-')
plt.legend(['$P3 = {} Pa$'.format(p) for p in p3_arr], loc=(1.05, 0.6), fontsize=16)
for output, col in zip(outputs_l1, colors):
    plt.plot(output[:,0], output[:,11]*1E3, col+'--')
plt.ticklabel_format(axis='both', style='plain', scilimits=(-1,1))
plt.xlabel('$l1 (m)$')
plt.ylabel('G $(J / m^2) * 10^{-3}$')
plt.xlim(xmin=.2)
plt.ylim(ymax=2, ymin=0)

plt.subplots_adjust(top=0.8, bottom=0.15, right=0.7)

1 个答案:

答案 0 :(得分:1)

使用列名而不是数字并组合两个绘图循环,

col = {name:i for i,name in enumerate(header)}

fig = plt.figure()
for data,color in zip(outputs_l1, colors):
    xs  = data[:, col["l1"     ]]
    wl = data[:, col["w_left" ]] * 1000.0    # column 10
    wr = data[:, col["w_right"]] * 1000.0    # column 11
    plt.plot(xs, wl, color + "-", wr, color + "--")

可能的错误变得清晰:您说您想要图G,但是您要指定w(cols 10和11,而不是cols 12和13)。

可能w_leftw_data未出现,因为它们超出了指定的限制(plt.ylim(ymax=2, ymin=0))?

我认为你真正想要的是

fig = plt.figure()
for data,color in zip(outputs_l1, colors):
    xs  = data[:, col["l1"     ]]
    gl = data[:, col["G_left" ]] * 1000.0    # column 12
    gr = data[:, col["G_right"]] * 1000.0    # column 13
    plt.plot(xs, gl, color + "-", gr, color + "--")

def loadfile(filename, skip=[], *args):

传递[]作为默认参数有点危险,因为对默认列表的更改可能会在对函数的调用中持续存在,从而导致非常奇怪的结果。你应该做

def loadfile(filename, skip=None, *args):
    skip = skip or []

除了你只使用skip进行成员资格测试,所以它会更快作为一个集合,所以它变成了

def loadfile(filename, skip=None, *args):
    skip = set(skip or [])

此外,

    output = []
    with open(filename, *args) as f:
        reader = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        for i, row in enumerate(reader):
            if not(i in skip):
                output.append(row)
    return np.array(output)

可以缩短为

    with open(filename, *args) as f:
        cr = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        return np.array(row for i,row in enumerate(cr) if i not in skip)

结果是一个numpy 2d数组;所以

outputs_l1 = [loadfile('FILE.csv'.format(p)) for p in p3_arr]

看起来p3_arr是一个列表,用于确定您要查看的数据集;然后outputs_l1成为2d数组的列表。这是一个误导性的名称,因为查看headerl1应该是每个2d数组的第一列;因此outputs_l1逻辑上应该是仅包含第一列数据的二维数组。我建议将其重命名为p_data