字符串UTF-8编码,在H2O中使用西里尔文

时间:2017-06-26 02:58:56

标签: character-encoding h2o

我用西里尔字符串加载utf-8编码的csv文件。在Flow界面解析后 - 我看不到西里尔字母,但不是像“пїўпѕЂпѕ™пїђпѕ”这样的可读符号我如何在H2O中使用utf-8西里尔字符串?

2 个答案:

答案 0 :(得分:0)

这似乎是Flow界面中的错误,但仅限于setupParse命令。如果继续并执行导入,则会正确导入数据。

我已经在这里报告了这个错误,包括测试数据和截图(在Firefox中拍摄):

https://0xdata.atlassian.net/browse/PUBDEV-4640

因此,如果您有其他信息,或者您的错误行为不同,最好将其添加到错误报告中。

答案 1 :(得分:-1)

检查文本和二进制文件中的csv文件以查找西里尔文本的编码方式,如果是UTF-8,它应该如下所示:

<强>&安培;#1055;&安培;#1088;&安培;#1080;&安培;#1074;&安培;#1077;&安培;#1090;

单词

<强>Привет