尝试将y变量读入pyplot.scatter时发生IndexError

时间:2018-08-06 17:51:00

标签: python pandas csv matplotlib index-error

我要创建的最终产品是一个程序,该程序从csv(附加,称为OutputC.csv)获取输入,并允许用户从他们选择的列中绘制散点图。我决定先创建预选列的图形,然后再使用rawinput和变量。所以,我遇到的问题是如何将python将数据读取到pyplot中。数据从输入的csv中提取并写入到自己的文件(Qout14.csv)中,我试图从中进行绘制。不幸的是,即使x和y变量列表的长度相同,我也会收到IndexError。在进行一些读取时,我想知道问题是否可能是y数据在实例中没有逗号分隔数据,因此它可能只是将所有y读取为字符串,因此在其中没有其他内容。名单。令人困惑的是,对于x,变量的另一侧使用同一行代码。谁能指出我的错误可能在哪里?

Example of Inputs(Columns 1 and 7 of OutputC.csv):
pcp Qout14
2.3 7.20E-03
3   1.34E-02
3.3 1.50E-02
2.3 8.25E-03
3   1.32E-02
2.5 9.47E-03
3   1.28E-02
3.6 1.81E-02
2.5 1.02E-02
2.5 9.44E-03
2   6.00E-03
2.8 1.17E-02
2.8 1.12E-02
2.8 1.16E-02
  

回溯(最近通话最近):文件   “ C:\ Users \ jmiyama \ Desktop \ Python Files \ OutputCtoScatterplot.py”行   48英寸       main()主文件中的第35行,文件“ C:\ Users \ jmiyama \ Desktop \ Python Files \ OutputCtoScatterplot.py”       y = [row.split(',')[1] for data [1:]]中的行IndexError:列表索引超出范围

import csv
import numpy as np
import matplotlib.pyplot as plt
import pandas
import collections

def getColumn(filename, column):
    results = csv.reader(open(filename), dialect='excel')   
    return [result[column] for result in results]

def dictcolumn():
    pcp = getColumn("C:\\Users\\jmiyama\\Desktop\\Python Files\\OutputC.csv",1)
    Qout14 = getColumn("C:\\Users\\jmiyama\\Desktop\\Python Files\\OutputC.csv",7)
    scatter={}
    scatter["pcp"]= pcp
    scatter["Qout14"]= Qout14
    return scatter

def main():
    scatter = dictcolumn()
    file = 'Qout14.csv'
    with open(file, 'w+') as csv_file:
        writer = csv.writer(csv_file, lineterminator='\n')
        writer.writerows(zip(*scatter.values()))

    with open("Qout14.csv") as f:
        data = f.read()
    data = data.split('\n')
    # trying to split the zipped values into columns
    x = [row.split(',')[0] for row in data[1:]]
    #THE CODE WORKS UP TO HERE
    y = [row.split(',')[1] for row in data[1:]]
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.grid()

    plt.scatter(x,y)
    plt.xlabel('pcp')
    plt.ylabel('Qout14')
    plt.title('Qout14 vs pcp')
    plt.show()

if __name__ == '__main__':
   main()

1 个答案:

答案 0 :(得分:0)

data = data.split('\n')似乎在末尾添加了额外的“空白”行,因此下面的方法可以工作。

x = [row.split(',')[0] for row in data[1:-1]]
y = [row.split(',')[1] for row in data[1:-1]]