Question

以下代码对我有用，但不再适用。我收到了错误：

AttributeError：＆＃39; DataFrame＆＃39;对象没有属性＆＃39; toDF＆＃39;

if __name__ == "__main__":
  sc = SparkContext(appName="test")
  sqlContext = SQLContext(sc)

  df = sqlContext.read.format('com.databricks.spark.csv').\
    options(header='false',delimiter=',',inferSchema='true').load('test')

  ### rename columns
  df = df.toDF('a','b','c')
  ...
  sc.stop()

Answer 1

我明白了。看起来它与我们的火花版本有关。它适用于1.6

Answer 2

如果您使用的是Spark 1.6版，请使用此代码将rdd转换为df

from pyspark.sql import SQLContext, Row
sqlContext = SQLContext(sc)
df = sqlContext.createDataFrame(rdd)

如果您想为行分配标题，请使用此

df= rdd.map(lambda p: Row(ip=p[0], time=p[1], zone=p[2]))

ip，time，zone是此示例中的行标题。

pyspark AttributeError：＆＃39; DataFrame＆＃39;对象没有属性“toDF＆＃39;

2 个答案: