AttributeError:'NoneType'对象没有属性'_jvm'

时间:2020-05-06 18:21:26

标签: python pyspark attributeerror regexp-replace

我遇到了AttributeError

...    
jc = sc._jvm.functions.regexp_replace(_to_java_column(str), pattern, replacement)
AttributeError: 'NoneType' object has no attribute '_jvm'

输入以下代码:

def replace_to_spark_way(pattern, replace_text, str_to_check):
    return fs.regexp_replace(str_to_check, pattern, replace_text)

replace_from = partial(replace_to_spark_way, _MY_REGEXP, "__NAME__")

def generalizer_spark_way(text):
    """Generalizer for arguments."""
    text = replace_from(text)
    return text

def generalize_item(item):
    item['rep'] = generalizer_spark_way(item["gen"])
    return item

generalized_Rdd = df.map(js_loads).map(generalize_item) 
generalized_df = spark.createDataFrame(generalized_Rdd, dfSchema)

我有多个不完整的部分函数,​​这仅是显示问题的一个示例。 df的加载方式如下:

df = spark.read.load(path_to_data).select(*columns).toJSON()

我不知道这里出了什么问题...

先谢谢了。

0 个答案:

没有答案