从Web服务器获取UTF 8编码数据

时间:2017-07-28 16:13:19

标签: utf-8 character-encoding http-headers apache-nifi

我的数据管道是 - >

  

WebServer - >通过PipeLine获取数据 - > Solr的

在Nifi中使用GetHTTP处理器,我正在从Web服务器上阅读。处理器正在使用Accept Content-Type = content-type: text/plain; charset=utf-8。但是,当我在Solr中加载它时,我看到奇怪的字符。

当通过浏览器(从网络服务器)下载文件时,我看到一组不同的奇怪字符(在浏览器窗口和编辑器上,如记事本++)

在整个管道中,我只使用UTF 8字符集。

在solr,浏览器和下载文件中看到不同字符的原因可能是什么(记事本++ - 编码为UTF 8)

1 个答案:

答案 0 :(得分:0)

我使用InvokeHTTP代替GetHTTP或任何其他处理器来执行类似的http操作。 InvokeHTTP云可以帮助您查找详细信息。使用此处理器并将响应保存在文件共享中,我们云帮助您。或者您可以在处理器中更改调试lv,然后查找日志。