应用错误收集

时间：2017-07-28 16:13:19

标签： utf-8 character-encoding http-headers apache-nifi

我的数据管道是 - ＆gt;

WebServer - ＆gt;通过PipeLine获取数据 - ＆gt; Solr的

在Nifi中使用GetHTTP处理器，我正在从Web服务器上阅读。处理器正在使用Accept Content-Type = content-type: text/plain; charset=utf-8。但是，当我在Solr中加载它时，我看到奇怪的字符。

当通过浏览器（从网络服务器）下载文件时，我看到一组不同的奇怪字符（在浏览器窗口和编辑器上，如记事本++）

在整个管道中，我只使用UTF 8字符集。

在solr，浏览器和下载文件中看到不同字符的原因可能是什么（记事本++ - 编码为UTF 8）

答案 0 :(得分：0)

我使用InvokeHTTP代替GetHTTP或任何其他处理器来执行类似的http操作。 InvokeHTTP云可以帮助您查找详细信息。使用此处理器并将响应保存在文件共享中，我们云帮助您。或者您可以在处理器中更改调试lv，然后查找日志。