将自定义数据框架从pyspark写入Azure事件中心

时间:2019-09-25 14:17:03

标签: python pandas pyspark azure-eventhub

尝试将自定义熊猫数据框添加到Azure Event Hub。这是代码:

  dic = { 
           'body' : filter_data
    }
    df = pd.DataFrame(dic,index=[0])
    df1 = df.astype(str)
    ds = df1 \
        .select('body') \
  .write \
  .format("eventhubs") \
  .options(**ehEventConf) \
  .option("checkpointLocation", "output") \
  .save()

我遇到了类似"TypeError: 'str' object is not callable"

的错误

1 个答案:

答案 0 :(得分:0)

如以上错误所述,.select('body')在str对象(df1)上被调用,但不支持。该函数需要一个数据框(类似于sql的对象)。请尝试df.select('body')..