将带有字符串的列转换为虚拟变量,但只有1个虚拟列

时间:2019-03-27 14:36:30

标签: python pandas

我想将带有字符串的列转换为虚拟列。例如:

假设我具有以下数据框:

    df = pd.DataFrame(columns=["A"], data=["car", "house", "car", "ground", "plane", "sky", "car", "house"])

我可以使用pd.get_dummies(df),但这将为每个字符串输出一列。如何有效地创建它?这可行,但是如果有数百个不同的字符串,则效率不高:

    df.replace({"car": 0, "house": 1, "ground": 3, "plane":4, "sky":5})

0 个答案:

没有答案