标签: apache-spark
我需要读取具有多个字符集(UTF-16LE,UTF-8,Windows-1252等)的多个文件。
有什么解决方案可以使Dataframe或RDD的所有文件的内容在UTF-8上解码?
谢谢!