如何使用值中包含引号的字段来评估JSON路径?

时间:2018-05-14 20:33:25

标签: json apache-nifi jsonpath

我有一个NiFi流,它接收JSON文件并根据它们评估JSON Path参数。除了处理包含韩文文本的记录外,它完美地工作。 Jayway JSONPath评估器似乎无法识别转义" \"在双引号字符之前的标题字段中。下面是一个示例(添加新行以帮助格式化):

{"data": {"body": "[이데일리 김관용 기자] 우리 군이 2018 남북정상회담을 앞두고 남
북간 군사적 긴장\r\n완화와 평화로운 회담 분위기 조성을 위해 23일 0시를 기해 군사분계선
(MDL)\r\n일대에서의 대북확성기 방송을 중단했다.\r\n\r\n국방부는 이날 남북정상회담 계기 
대북확성기 방송 중단 관련 내용을 발표하며\r\n“이번 조치가 남북간 상호 비방과 선전활동을
 중단하고 ‘평화, 새로운 시작’을\r\n만들어 나가는 성과로 이어지기를 기대한다”고 밝혔
다.\r\n\r\n전방부대 우리 군 장병이 대북확성기 방송을 위한 장비를 점검하고 있다.\r\n[사
진=국방부공동취재단]\r\n\r\n\r\n\r\n▶ 당신의 생활 속 언제 어디서나 이데일리 \r\n▶ 
스마트 경제종합방송 ‘이데일리 TV’ | 모바일 투자정보 ‘투자플러스’\r\n▶ 실시간 뉴스와 
속보 ‘모바일 뉴스 앱’ | 모바일 주식 매매 ‘MP트래블러Ⅱ’\r\n▶ 전문가를 위한 국내 최상의 
금융정보단말기 ‘이데일리 마켓포인트 3.0’ | ‘이데일리 본드웹 2.0’\r\n▶ 증권전문가방송
 ‘이데일리 ON’ 1666-2200 | ‘ON스탁론’ 1599-2203\n<ⓒ종합 경제정보 미디어 이데일리 -
 무단전재 & 재배포 금지> \r\n", 
"mimeType": "text/plain", 
"language": "ko", 
"headline": "국방부 \"軍 대북확성기 방송, 23일 0시부터 중단\"", 
"id": "EDYM00251_1804232beO/5WAUgdlYbHS853hYOGrIL+Tj7oUjwSYwT"}}

如果此对象在我的文件中,则JSON路径会评估所有路径参数的空白。有没有办法迫使Jayway引擎识别" \"?它似乎在其他语言中正常运行。

1 个答案:

答案 0 :(得分:3)

在理解了确定路径和不确定路径之间的区别后,我能够解决这个问题。 Jayway github README指出以下内容将使路径无限并返回一个列表:

  

在评估路径时,您需要了解何时的概念   路径是明确的。如果路径包含:

,则路径不确定      

.. - 深度扫描操作符

     

?(<expression>) - 表达式

     

[<number>, <number> (, <number>)] - 多个数组索引不定路径   总是返回一个列表(由当前的JsonProvider表示)。

我的JSON如下所示:

{
  "Version":"14", 
  "Items":[
    {"data": {"body": "[이데일리 ... \r\n", 
              "mimeType": "text/plain", 
              "language": "ko", 
              "headline": "국방부 \"軍 ... 중단\"", 
              "id": "1"}
    },
   {"data": {"body": "[이데일리 ... \r\n", 
             "mimeType": "text/plain", 
             "language": "ko", 
             "headline": "국방부 \"軍 ... 중단\"", 
             "id": "2"}
   ...
   }
  ]
}

我使用的这个JSON路径选择器($.data.headline)没有像我预期的那样获取值。它改为返回空值。

将其更改为$.Items[*].data.headline$..data.headline会返回每个标题的列表。