标签: apache-spark pyspark apache-kafka pyspark-sql sttwitterapi
如何使用.filter查询某些条件的推文?
# sc.parallelize(lines).toDF() status=lines.map(lambda tweets: extractTweet(json.loads(tweets.encode('utf-8')))) tweet=status.filter(lambda y : y.lower().contain()) tweet.pprint()