我正在构建一个简单的散点图,用于从xls文件中读取数据。 这是经典的预期寿命×人均GDP的散点图。这是代码:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.cm as cm
#ler a terceira sheet da planilha
data = pd.read_excel('sample.xls', sheet_name=0)
data.head()
plt.scatter(x = data['LifeExpec'],
y = data['GDPperCapita'],
s = data['PopX1000'],
c = data['PopX1000'],
cmap=cm.viridis,
edgecolors = 'none',
alpha = 0.7)
for estado in range(len(data['UF'])):
plt.text(x = data['LifeExpec'][estado],
y = data['GDPperCapita'][estado],
s = data['UF'][estado],
fontsize = 14)
plt.colorbar()
plt.show()
xls文件(PopX1000)中的population列定义了气泡大小,目前它也定义了它们的颜色。 我希望气泡可以根据人口(就像现在这样)改变大小,但颜色会根据州的地区而变化。
我相信我不能简单地更改c属性,因为它需要一个浮点值。 关于如何做到这一点的任何提示?
答案 0 :(得分:0)
您可以将Region
转换为数字表示形式,并将其用作"键"你的色彩映射。下面是两种方法(一种是注释掉,选择你选择的,结果应该是相同的):
plt.scatter(x = data['LifeExpec'],
y = data['GDPperCapita'],
s = data['PopX1000'],
c = pd.factorize(data['Region'])[0],
# Alternatively:
# c = data['Region'].astype('category').cat.codes
cmap=cm.viridis,
edgecolors = 'none',
alpha = 0.7)