使用CSV文件问题中的matplotlib绘制散点图

时间:2019-02-02 07:48:54

标签: python csv matplotlib scatter-plot

我从一个网站到一个CSV文件中提取一些数据,我需要从CSV文件情节matplotlib散点图。我只需要CSV文件中的第2列和第3列数据。

我正在尝试使用for循环将CSV数据收集到一个列表中,然后使用它来绘制散点图,但出现“ ValueError:x和y必须为相同大小”错误。

import matplotlib.pyplot as plt
import csv

with open(cache_path + distance_csv) as csv_file:
reader = csv.reader(csv_file)

for column in reader:
    city_distance = [x[1] for x in csv.reader(csv_file)]
    crime_rate = [x[2] for x in csv.reader(csv_file)]

    plt.scatter(city_distance, crime_rate)
    plt.show()

我的CSV文件中的第2列和第3列的长度相同-83个单元格,但出现ValueError。我在这里想念什么?

1 个答案:

答案 0 :(得分:0)

您的代码中存在一些错误,我不知道是哪个错误导致了您的行为,但是在修复所有错误之后,您可以继续进行操作:

  1. 首先,看看如何阅读这些列。请注意,您遍历了reader中的 column ,但从未使用过 column (在for循环的每次迭代中都创建了两个新的csv.readers)。然后在此答案中寻找可能的解决方案。
  2. 因此,您正在读取“ with”语句范围之外的 csv_file ,因此该文件已被关闭。如果您将使用for循环和,则无论如何都不必解决此问题。
  3. 您要在每次迭代中绘图(因此您将创建83个绘图,我想您不想要这样做)。

因此可能的解决方案是:

import matplotlib.pyplot as plt
import csv

with open(cache_path + distance_csv) as csv_file:
  reader = csv.reader(csv_file)
city_distance, crime_rate  = [], []
for column in reader:
  city_distance.append(float(column[1]))
  crime_rate.append(float(column[2]))
plt.scatter(city_distance, crime_rate)
plt.show()

为了将来,我建议您尝试验证len(city_distance)==len(crime_rate)。 我的意思是,在读取值之后并在错误之前,不检查csv中的数据,而是检查代码中的数据-以获取最有用的信息。