如何将LabelBinarizer列添加到DataFrame

时间:2018-06-18 12:39:28

标签: python pandas scikit-learn

我最近通过运行以下代码开始使用LabelBinarizer。 (here are the first couple of rows of the CSV file that I'm using):

import pandas as pd
from sklearn.preprocessing import LabelBinarizer
#import matplotlib.pyplot as plot


#--------------------------------

label_conv = LabelBinarizer()
appstore_original = pd.read_csv("AppleStore.csv")

#--------------------------------

lb_conv = label_conv.fit_transform(appstore["cont_rating"])
column_names = label_conv.classes_

print(column_names)        
print(lb_conv)

我得到了lb_conv和列名。因此:

如何使用label_conv作为列名将appstore_original附加到column_names

如果有人能提供帮助那就太棒了。

1 个答案:

答案 0 :(得分:0)

试试这个:

lb = LabelBinarizer()

df = pd.read_csv("AppleStore.csv")

df = df.join(pd.DataFrame(lb.fit_transform(df["cont_rating"]),
                          columns=lb.classes_, 
                          index=df.index))

为了确保新创建的DF将具有与原始DF相同的索引元素(我们需要它来加入),我们将在构造函数调用中指定index=df.index