pandas get_dummies语法错误

时间:2017-03-18 21:38:45

标签: python pandas syntax-error dummy-variable

我有一个30k大小的数据集。我有一个名为" Native Country"我想为该列中的每个唯一值创建一个新变量(我使用的算法只能处理数值,所以我需要将文本转换为二进制形式)。

当我使用以下内容时:

Native Country = pd.get_dummies(dataset.Native Country , prefix='Native Country' )
Native Country.head()

我收到以下错误消息

SyntaxError:语法无效

请提出任何建议。

1 个答案:

答案 0 :(得分:0)

Python标识符不能包含空格。因此,您必须在变量名称中使用下划线而不是空格。如果列名称有空格,您还必须使用[…]而不是.访问列。

In [1]: import pandas as pd

In [2]: dataset = pd.DataFrame({'Native Country': ['a', 'b', 'a']})

In [6]: native_country = pd.get_dummies(dataset['Native Country'], prefix='Native Country'
   ...: )

In [7]: native_country.head()
Out[7]:
   Native Country_a  Native Country_b
0                 1                 0
1                 0                 1
2                 1                 0