我遇到了AttributeError
...
jc = sc._jvm.functions.regexp_replace(_to_java_column(str), pattern, replacement)
AttributeError: 'NoneType' object has no attribute '_jvm'
输入以下代码:
def replace_to_spark_way(pattern, replace_text, str_to_check):
return fs.regexp_replace(str_to_check, pattern, replace_text)
replace_from = partial(replace_to_spark_way, _MY_REGEXP, "__NAME__")
def generalizer_spark_way(text):
"""Generalizer for arguments."""
text = replace_from(text)
return text
def generalize_item(item):
item['rep'] = generalizer_spark_way(item["gen"])
return item
generalized_Rdd = df.map(js_loads).map(generalize_item)
generalized_df = spark.createDataFrame(generalized_Rdd, dfSchema)
我有多个不完整的部分函数,这仅是显示问题的一个示例。 df的加载方式如下:
df = spark.read.load(path_to_data).select(*columns).toJSON()
我不知道这里出了什么问题...
先谢谢了。