使用Pandas进行条件行选择

时间:2016-09-13 17:26:53

标签: python pandas

我想选择一个pandas数据框df的子集,其中列text的值为'0.0, 0.0'。我认为这个命令是df.ix[df['text'] == "0.0, 0.0"],但这会返回

<console>:1: error: identifier expected but symbol literal found.
   df.ix[df['text'] == "0.0, 0.0"]
            ^
<console>:1: error: unclosed character literal
   df.ix[df['text'] == "0.0, 0.0"]
                 ^

我做错了什么?

1 个答案:

答案 0 :(得分:1)

正如DSM指出的那样,错误似乎是Scala编程语言的错误。这是因为我使用的是Zeppelin Notebook,并且没有指定应该使用pyspark解释器解释代码。指定解释器后,代码按预期工作。