我正在尝试使用for循环使子图遍历数据帧中的x变量。所有的图都是散点图。
X-variable: 'Protein', 'Fat', 'Sodium', 'Fiber', 'Carbo', 'Sugars'
y-variable: 'Cal'
这就是我被困住的地方
plt.subplot(2, 3, 2)
for i in range(3):
plt.scatter(i,sub['Cal'])
答案 0 :(得分:2)
使用以下代码:
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv('data.csv')
columns = list(df.columns)
columns.remove('Cal')
fig, ax = plt.subplots(1, len(columns), figsize = (20, 5))
for idx, col in enumerate(columns, 0):
ax[idx].plot(df['Cal'], df[col], 'o')
ax[idx].set_xlabel('Cal')
ax[idx].set_title(col)
plt.show()
我得到了散点图的这个子图:
但是,也许最好使用单个散点图并使用标记颜色来区分数据类型。看到以下代码:
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
sns.set_style('darkgrid')
df = pd.read_csv('data.csv')
# df.drop(columns = ['Sodium'], inplace = True) # <--- removes 'Sodium' column
table = df.melt('Cal', var_name = 'Type')
fig, ax = plt.subplots(1, 1, figsize = (10, 10))
sns.scatterplot(data = table,
x = 'Cal',
y = 'value',
hue = 'Type',
s = 200,
alpha = 0.5)
plt.show()
给出所有数据在一起的图:
'Sodium'
的值到目前为止与其他值有所不同,因此,如果您使用以下行删除此列:
df.drop(columns = ['Sodium'], inplace = True)
您会得到更具可读性的情节: