我用西里尔字符串加载utf-8编码的csv文件。在Flow界面解析后 - 我看不到西里尔字母,但不是像“пїўпѕЂпѕ™пїђпѕ”这样的可读符号我如何在H2O中使用utf-8西里尔字符串?
答案 0 :(得分:0)
这似乎是Flow界面中的错误,但仅限于setupParse命令。如果继续并执行导入,则会正确导入数据。
我已经在这里报告了这个错误,包括测试数据和截图(在Firefox中拍摄):
https://0xdata.atlassian.net/browse/PUBDEV-4640
因此,如果您有其他信息,或者您的错误行为不同,最好将其添加到错误报告中。
答案 1 :(得分:-1)
检查文本和二进制文件中的csv文件以查找西里尔文本的编码方式,如果是UTF-8,它应该如下所示:
<强>&安培;#1055;&安培;#1088;&安培;#1080;&安培;#1074;&安培;#1077;&安培;#1090; 强>
单词
<强>Привет强>