我想将带有字符串的列转换为虚拟列。例如:
假设我具有以下数据框:
df = pd.DataFrame(columns=["A"], data=["car", "house", "car", "ground", "plane", "sky", "car", "house"])
我可以使用pd.get_dummies(df),但这将为每个字符串输出一列。如何有效地创建它?这可行,但是如果有数百个不同的字符串,则效率不高:
df.replace({"car": 0, "house": 1, "ground": 3, "plane":4, "sky":5})