我有一个包含大量列的数据框(81)。 我需要列出仅包含字符串的列。
我试图编写简单的代码行。 没用这是:
features = ""
def encode_features(df_train, df_test):
for column in df_test:
if column.dtype() == "string" or "str" or "object":
features.append(column)
df_combined = pd.concat([df_train[features], df_test[features]])
for feature in features:
le = preprocessing.LabelEncoder()
le = le.fit(df_combined[feature])
df_train[feature] = le.transform(df_train[feature])
df_test[feature] = le.transform(df_test[feature])
return df_train, df_test
data_train, data_test = encode_features(data_train, data_test)
data_train.head()
我已经预料会有一个错误,因为我不知道如何执行此操作。 预先谢谢你。
P.S。这是在python 3.7上运行的