我最近通过运行以下代码开始使用LabelBinarizer。 (here are the first couple of rows of the CSV file that I'm using):
import pandas as pd
from sklearn.preprocessing import LabelBinarizer
#import matplotlib.pyplot as plot
#--------------------------------
label_conv = LabelBinarizer()
appstore_original = pd.read_csv("AppleStore.csv")
#--------------------------------
lb_conv = label_conv.fit_transform(appstore["cont_rating"])
column_names = label_conv.classes_
print(column_names)
print(lb_conv)
我得到了lb_conv和列名。因此:
如何使用label_conv
作为列名将appstore_original
附加到column_names
?
如果有人能提供帮助那就太棒了。
答案 0 :(得分:0)
试试这个:
lb = LabelBinarizer()
df = pd.read_csv("AppleStore.csv")
df = df.join(pd.DataFrame(lb.fit_transform(df["cont_rating"]),
columns=lb.classes_,
index=df.index))
为了确保新创建的DF将具有与原始DF相同的索引元素(我们需要它来加入),我们将在构造函数调用中指定index=df.index
。