来自pyspark.sql.snappy import SnappyContext - ImportError:没有名为snappy的模块

时间:2017-10-31 10:09:21

标签: python-2.7 pyspark pyspark-sql snappydata snappydb

每当我尝试从下面的代码导入pyspark.sql.snappy导入SnappyContext时重新安装pyspark和snappydata:

from pyspark.sql.snappy import SnappyContext
from pyspark.storagelevel import StorageLevel
SparkContext._ensure_initialized()

spark = SparkSession.builder.appName("test")  \
                        .master("local[*]") \
                        .config("spark.snappydata.connection", "localhost:1527") \
                        .getOrCreate() 

snappy = SnappySession(spark)
snappy.sql("SELECT col1, min(col2) from TABLE1")

我收到错误:

Traceback (most recent call last):
  File "testpy.py", line 4, in <module>
    from pyspark.sql.snappy import SnappyContext
ImportError: No module named snappy

请帮忙!

1 个答案:

答案 0 :(得分:1)

这是上次发布的版本中的一个已知问题。这已在最新的主人中修复。 $ SNAPPY_HOME / bin / pyspark引用$ SNAPPY_HOME / pyspark文件夹中的python脚本。不幸的是,一些构建更改停止复制文件夹中的SnappyData python脚本。您可以构建当前主服务器以使用pyspark。