标签: apache-spark apache-spark-sql orc
我正在从S3加载一些ORC表,但是我猜想字符编码存在一些问题。在结果数据框中,“á”,“â”,“ñ”等字符将无法正确显示(所有字段均为StringType),并且我找不到与字符编码有关的任何spark / sql / hive属性,字符集或类似的内容。以前有人处理过吗?