pyspark:从地图类型列中选择带有特殊字符的列

时间:2018-08-29 14:23:29

标签: python dataframe pyspark pyspark-sql

在从数据框中选择某些列的查询中,我有一个列类型:map,它具有多个属性。 我正在尝试从此列中仅选择几个属性,但是由于某些属性包含特殊字符(如'-'),这使我返回错误 此列的其他属性都可以正常工作

示例:

sqlContext.sql("select colA, colB.attribute1 from schema.table")

但是,如果我选择一个包含-的属性,它将失败

sqlContext.sql("select colA, colB.4-TRANSPORT from schema.table")

=>失败

18/08/29 15:21:34 INFO ParseDriver: Parse Completed
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/hdp/2.5.3.16-1/spark/python/pyspark/sql/context.py", line 580, in sql
    return DataFrame(self._ssql_ctx.sql(sqlQuery), self)
  File "/usr/hdp/2.5.3.16-1/spark/python/lib/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in __call__
  File "/usr/hdp/2.5.3.16-1/spark/python/pyspark/sql/utils.py", line 51, in deco
    raise AnalysisException(s.split(': ', 1)[1], stackTrace)
pyspark.sql.utils.AnalysisException: u"cannot resolve 'TRANSPORT'

我尝试用双引号等,到目前为止还没有运气...

1 个答案:

答案 0 :(得分:0)

反引号会有所帮助。

sqlContext.sql("select colA, colB.`4-TRANSPORT` from schema.table")

根据评论进行了更新。