NameError:未定义名称“ countryCodeMap”

时间:2020-06-30 17:31:33

标签: apache-spark pyspark apache-spark-sql spark-streaming

我正在尝试在Databricks群集中实现Spark程序,并且正在关注链接如下的文档:

现在,在此代码行之后:

def mapKeyToVal(mapping):
  def mapKeyToVal_(col):
    return mapping.get(col)
  return udf(mapKeyToVal_, StringType())

我正在使用这个:

gameInfDf = gameInfDf.withColumn("country_code", mapKeyToVal(countryCodeMap)("country"))

我收到错误消息:未定义名称“ countryCodeMap”

如果有人可以帮助我,那将是很棒的事情。

1 个答案:

答案 0 :(得分:1)

https://databricks.com/blog/2018/07/09/analyze-games-from-european-soccer-leagues-with-apache-spark-and-databricks.html是数据砖的正式指南。

请参见下图。您需要单击lkink并导入.dbc

enter image description here

然后您将看到各种设置内容。例如。需要的地图。好东西。

您可以看到一些地图:

situationMap = {1:'Open play', 2:'Set piece', 3:'Corner', 4:'Free kick', 99:'NA'}

countryCodeMap = {'germany':'DEU', 'france':'FRA', 'england':'GBR', 'spain':'ESP', 'italy':'ITA'}