从db中读取阿拉伯文本,并以拼写格式存储在s3中

时间:2018-12-05 11:57:42

标签: amazon-s3 pyspark pyspark-sql amazon-athena

我有一个pyspark脚本,该脚本读取mysql数据,该数据包含数据框中的列值,并将数据以拼写格式存储在aws s3中,但是在使用aws athena进行查询时,它显示了一些随机文本而不是阿拉伯文。我做错了。请帮助进行排序。 我收到的文字是Ãâ¦Â±ÃƲ...,如何将其转换为阿拉伯语。

使用pyspark从mysql读取数据时,我正在获取以下格式的数据:“الØØØرقية”。

谢谢。

1 个答案:

答案 0 :(得分:0)

从mysql读取内容时,我们需要使用URL字符串例如“?useUnicode = true&characterEncoding = UTF-8”传递

new_names_txt

这解决了我的问题。