我是熊猫的新手,而且是seaborn。 我有一个简单的CSV文件,如下所示:
quarter;industry1;industry2;industry3;job_vacancy
1990-Q1;manufacturing;food, beverages and tobacco;food, beverages and tobacco;500
1990-Q1;manufacturing;textile and wearing apparel;textile and wearing apparel;5100
1990-Q1;manufacturing;paper products and publishing;paper products and publishing;1100
1990-Q1;manufacturing;petroleum and chemical products;petroleum and chemical products;600
1990-Q1;manufacturing;rubber and plastic products;rubber and plastic products;100
在Jupyter笔记本中,我试图绘制条形图。
到目前为止,还好。 但是实际数据并非全都是数字。因此,例如,我将最后一行的值更改为“-”。
quarter;industry1;industry2;industry3;job_vacancy
1990-Q1;manufacturing;food, beverages and tobacco;food, beverages and tobacco;500
1990-Q1;manufacturing;textile and wearing apparel;textile and wearing apparel;5100
1990-Q1;manufacturing;paper products and publishing;paper products and publishing;1100
1990-Q1;manufacturing;petroleum and chemical products;petroleum and chemical products;600
1990-Q1;manufacturing;rubber and plastic products;rubber and plastic products;-
我可以知道实际情况吗?我知道整个数据帧中都有非数字值,但我想我只获得整个数据的前3名,并且它们的“ job_vacancy”列都具有数字值?
如何制作条形图?
我以某种方式使其工作。我的方法是对数据框进行深层复制,并感谢@asongtoruin,将所有内容都设置为数字。
df = pd.read_csv("test.csv", delimiter=";")
data = df.loc[:2].copy(1)
data.head()
data['job_vacancy'] = pd.to_numeric(arg=data['job_vacancy'],errors='coerce').fillna(0)
snsplot = sns.barplot(x="industry3", y="job_vacancy", data=data, orient="v")
现在我只是想知道这是正确还是正确的方法。