Question

我要创建的最终产品是一个程序，该程序从csv（附加，称为OutputC.csv）获取输入，并允许用户从他们选择的列中绘制散点图。我决定先创建预选列的图形，然后再使用rawinput和变量。所以，我遇到的问题是如何将python将数据读取到pyplot中。数据从输入的csv中提取并写入到自己的文件（Qout14.csv）中，我试图从中进行绘制。不幸的是，即使x和y变量列表的长度相同，我也会收到IndexError。在进行一些读取时，我想知道问题是否可能是y数据在实例中没有逗号分隔数据，因此它可能只是将所有y读取为字符串，因此在其中没有其他内容。名单。令人困惑的是，对于x，变量的另一侧使用同一行代码。谁能指出我的错误可能在哪里？

Example of Inputs(Columns 1 and 7 of OutputC.csv):
pcp Qout14
2.3 7.20E-03
3   1.34E-02
3.3 1.50E-02
2.3 8.25E-03
3   1.32E-02
2.5 9.47E-03
3   1.28E-02
3.6 1.81E-02
2.5 1.02E-02
2.5 9.44E-03
2   6.00E-03
2.8 1.17E-02
2.8 1.12E-02
2.8 1.16E-02

回溯（最近通话最近）：文件 “ C：\ Users \ jmiyama \ Desktop \ Python Files \ OutputCtoScatterplot.py”行 48英寸 main（）主文件中的第35行，文件“ C：\ Users \ jmiyama \ Desktop \ Python Files \ OutputCtoScatterplot.py” y = [row.split（'，'）[1] for data [1：]]中的行IndexError：列表索引超出范围

import csv
import numpy as np
import matplotlib.pyplot as plt
import pandas
import collections

def getColumn(filename, column):
    results = csv.reader(open(filename), dialect='excel')   
    return [result[column] for result in results]

def dictcolumn():
    pcp = getColumn("C:\\Users\\jmiyama\\Desktop\\Python Files\\OutputC.csv",1)
    Qout14 = getColumn("C:\\Users\\jmiyama\\Desktop\\Python Files\\OutputC.csv",7)
    scatter={}
    scatter["pcp"]= pcp
    scatter["Qout14"]= Qout14
    return scatter

def main():
    scatter = dictcolumn()
    file = 'Qout14.csv'
    with open(file, 'w+') as csv_file:
        writer = csv.writer(csv_file, lineterminator='\n')
        writer.writerows(zip(*scatter.values()))

    with open("Qout14.csv") as f:
        data = f.read()
    data = data.split('\n')
    # trying to split the zipped values into columns
    x = [row.split(',')[0] for row in data[1:]]
    #THE CODE WORKS UP TO HERE
    y = [row.split(',')[1] for row in data[1:]]
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.grid()

    plt.scatter(x,y)
    plt.xlabel('pcp')
    plt.ylabel('Qout14')
    plt.title('Qout14 vs pcp')
    plt.show()

if __name__ == '__main__':
   main()

Answer 1

data = data.split('\n')似乎在末尾添加了额外的“空白”行，因此下面的方法可以工作。

x = [row.split(',')[0] for row in data[1:-1]]
y = [row.split(',')[1] for row in data[1:-1]]

尝试将y变量读入pyplot.scatter时发生IndexError

1 个答案: