我目前是Apache Nifi的新手,并且仍在探索中。 我做了一个自定义处理器,在其中我将通过分页从服务器获取数据。 我传递了包含属性“ url”的输入文件。 最后,当我通过分页获取数据时,将响应传输到输出流文件中,因此我为每个页面制作了一个新的输出流文件,并将其传输到成功关系。 下面是代码部分:
@Override
public void onTrigger(final ProcessContext context, final ProcessSession session) throws ProcessException {
FlowFile incomingFlowFile = session.get();
String api = null;
if (incomingFlowFile == null) {
logger.info("empty input flow file");
session.commit();
return;
} else {
api=incomingFlowFile.getAttribute("url");
}
session.remove(incomingFlowFile);
if(api == null) {
logger.warn("API url is null");
session.commit();
return;
}
int page = Integer.parseInt(context.getProperty(PAGE).getValue());
while(page < 3) {
try {
String url = api + "&curpg=" + page;
logger.info("input url is: {}", url);
HttpResponse response = httpGetApiCall(url, 10000);
if(response == null || response.getEntity() == null) {
logger.warn("response null");
session.commit();
return;
}
String resp = EntityUtils.toString(response.getEntity());
InputStream is = new ByteArrayInputStream(StandardCharsets.UTF_16.encode(resp).array());
FlowFile outFlowFile = session.create();
outFlowFile = session.importFrom(is, outFlowFile);
session.transfer(outFlowFile, SUCCESSFUL);
} catch (IOException e) {
logger.warn("IOException :{}", e.getMessage());
return;
}
++page;
}
session.commit();
}
我面临的问题是,对于单个输入流文件,此处理器会触发两次,因此它会为单个输入流文件生成4个流文件。
我无法弄清楚我做错了什么。 请帮助解决这个问题。 预先感谢。
================================================ ======================= processor group 1(Nifi_Parvin)