这一定非常简单,但我无法弄清楚如何去做。我正在尝试绘制数据集中的数据。
以下是我的代码,
import pandas as pd
import matplotlib.pyplot as plt
dataset = pd.read_csv('TipsReceivedPerMeal.csv')
plt.scatter(dataset[0],dataset[1])
plt.show()
我的CSV文件中的数据是一些随机数据,用于指定服务员在某一天收到的提示。
CSV中的数据
MealNumber TipReceived
1 17
2 10
3 5
4 7
5 14
6 25
提前感谢您的帮助。
答案 0 :(得分:4)
另一种选择是替换
plt.scatter(dataset[0],dataset[1])
与
plt.scatter(dataset[[0]],dataset[[1]])
答案 1 :(得分:1)
只需更换:
plt.scatter(dataset[0],dataset[1])
使用:
plt.scatter(dataset['MealNumber'],dataset['TipReceived'])
在Pandas中,列可以通过名称或列号使用iloc引用。
答案 2 :(得分:1)
有几个选项,其中一些已在之前的答案中提及,
plt.scatter(dataset['MealNumber'],dataset['TipReceived'])
(如@Ankit Malik所述)plt.scatter(dataset.iloc[:,0],dataset.iloc[:,1])
plt.scatter(dataset[[0]],dataset[[1]])
(正如@Miriam所说)为了让那些人使用问题中的数据,应该使用delim_whitespace=True
参数,否则读入将不起作用:
dataset = pd.read_csv('TipsReceivedPerMeal.csv', delim_whitespace=True)