我是python中的初学者编程,我只是想从pyspark包导入一些功能。问题是,当我写这篇文章时:
from pyspark.ml.feature import HashingTF, IDF, Tokenizer
据说"未解决的参考pyspark"。那是为什么?
以下是我创建proyect的步骤:
答案 0 :(得分:1)
你的Python库中有df.assign(datetime=pd.to_datetime(df.datetime))\
.set_index('datetime').resample('1T').first() * 100
price
datetime
2016-10-03 11:00:00 1002.0
2016-10-03 11:01:00 1021.0
2016-10-03 11:02:00 1056.0
2016-10-03 11:03:00 1080.0
2016-10-03 11:04:00 1101.0
2016-10-03 11:05:00 NaN
2016-10-03 11:06:00 1098.0
吗?
从截图中看,您看起来已经有了zip文件(pyspark
),但是您需要在使用之前将其解压缩。
屏幕截图将您的Python库根目录显示为pyspark...tar.gz
。尝试将python3.6
提取到pyspark...tar.gz
并查看是否可以解决您的问题。
此外,这是一个使用PySpark + Jupyter的酷教程: https://blog.sicara.com/get-started-pyspark-jupyter-guide-tutorial-ae2fe84f594f