使用seaborn进行绘图时在pandas列中转换数据类型

时间:2020-07-02 15:06:24

标签: python pandas machine-learning seaborn data-science

我一直在尝试使用seaborn regplot从我的数据集中绘制价格与km / 100L的关系。我已经尝试将两列的数据类型都转换为int64,但是它不起作用。

automobile_df["price"].astype("int64")
automobile_df["km/100L"].astype("int64")

然后我尝试使用海洋图书馆的regplot绘制价格与km / 100L的关系。

sns.regplot(x="km/100L",y="price",data="automobile_df")

我得到的完整错误消息是

    TypeError                                 Traceback (most recent call last)
<ipython-input-53-fdf8be478666> in <module>()
----> 1 sns.regplot(x="km/100L",y="price",data="temp_df")


/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in regplot(x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, label, color, marker, scatter_kws, line_kws, ax)
    807                                  order, logistic, lowess, robust, logx,
    808                                  x_partial, y_partial, truncate, dropna,
--> 809                                  x_jitter, y_jitter, color, label)
    810 
    811     if ax is None:

/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in __init__(self, x, y, data, x_estimator, x_bins, x_ci, scatter, fit_reg, ci, n_boot, units, seed, order, logistic, lowess, robust, logx, x_partial, y_partial, truncate, dropna, x_jitter, y_jitter, color, label)
    107         # Extract the data vals from the arguments or passed dataframe
    108         self.establish_variables(data, x=x, y=y, units=units,
--> 109                                  x_partial=x_partial, y_partial=y_partial)
    110 
    111         # Drop null observations

/usr/local/lib/python3.6/dist-packages/seaborn/regression.py in establish_variables(self, data, **kws)
     43         for var, val in kws.items():
     44             if isinstance(val, str):
---> 45                 vector = data[val]
     46             elif isinstance(val, list):
     47                 vector = np.asarray(val)

TypeError: string indices must be integers

2 个答案:

答案 0 :(得分:0)

您仅提供数据字符串,即数据框的名称。相反,它应该是数据框本身,因此不能使用引号。如果数据框中的各列,还请确保xy是正确的名称。

答案 1 :(得分:0)

我认为问题是因为astype()默认情况下会返回一个副本(请参见documentation),因此您必须将结果分配给同一列,如下所示:

automobile_df["price"] = automobile_df["price"].astype("int64")
automobile_df["km/100L"] = automobile_df["km/100L"].astype("int64")

或者如果您只是想在打印时更改类型,请像这样使用它

sns.regplot(x=automobile_df["km/100L"].astype("int64"),y=automobile_df["price"].astype("int64"))