如何解析Pyspark数据帧查询错误关键字不能是表达式

时间:2017-10-17 04:48:44

标签: python spark-dataframe pyspark-sql

我有两个名为tweetsDF和HashtagsDF的数据帧。两个数据帧的tweet_status_id相等,我想检索单个推文的主题标签数。这是我正在使用的查询,其中inturns抛出

ERROR : SyntaxError: keyword can't be an expression

tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show()

查询中哪里错了?

1 个答案:

答案 0 :(得分:3)

尝试tweetsDF.tweet_status_id == '636984052600274944'==代替=)。