无法正确解析xml到json

时间:2017-05-22 06:39:23

标签: node.js parsing xml2js

我正在尝试将xml解析为json&我在nodejs中使用xml2js。 以下是我的代码

var chai = require('chai');
var chaiHttp = require('chai-http');
var request = chai.request;
var should = chai.should();
var expect = chai.expect;
var assert = chai.assert;
var supertest = require('supertest');
var fs = require('fs');
var xmlLocation = "./configdata/xmlDoc.xml";

var xml2js = require('xml2js');
var parser = new xml2js.Parser();

//Plugin for HTTP, etc.
chai.use(chaiHttp);
process.env['NODE_TLS_REJECT_UNAUTHORIZED'] = '0';

//xmlFile = JSON.parse(fs.readFileSync(xmlData, 'utf8'));


describe("Test : ", function () {

    it("convert xml to json", function (done) {

        r = fs.readFileSync(xmlLocation, 'UTF-8');
        parser.parseString(r, function (err, parsedData) {
            if (err) throw err;
            else {
                fs.writeFile("jsonData.json", JSON.stringify(parsedData), function (err, response) {
                });
            }
        });

        done();
    });

})

我的示例xml文件:

<?xml version="1.0" encoding="UTF-8" ?>
<ALEXA>
    <SD TITLE="A" FLAGS="" HOST="davidwalsh.name">
        <TITLE TEXT="David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"/>
        <LINKSIN NUM="1102"/>
        <SPEED TEXT="1421" PCT="51"/>
    </SD>
    <SD>
        <POPULARITY URL="davidwalsh.name/" TEXT="7131"/>
        <REACH RANK="5952"/>
        <RANK DELTA="-1648"/>
    </SD>
</ALEXA>

我得到以下输出:

{
  "ALEXA": {
    "SD": [
      {
        "$": {
          "TITLE": "A",
          "FLAGS": "",
          "HOST": "davidwalsh.name"
        },
        "TITLE": [
          {
            "$": {
              "TEXT": "David Walsh Blog :: PHP, MySQL, CSS, Javascript, MooTools, and Everything Else"
            }
          }
        ],
        "LINKSIN": [
          {
            "$": {
              "NUM": "1102"
            }
          }
        ],
        "SPEED": [
          {
            "$": {
              "TEXT": "1421",
              "PCT": "51"
            }
          }
        ]
      },
      {
        "POPULARITY": [
          {
            "$": {
              "URL": "davidwalsh.name/",
              "TEXT": "7131"
            }
          }
        ],
        "REACH": [
          {
            "$": {
              "RANK": "5952"
            }
          }
        ],
        "RANK": [
          {
            "$": {
              "DELTA": "-1648"
            }
          }
        ]
      }
    ]
  }
}

'$'被添加到解析的json中。如何避免.. ??

寻找解决方案。提前谢谢。

3 个答案:

答案 0 :(得分:0)

$是您使用默认配置的属性的地方。

由于xml2js将您的XML标记(例如SD)显式解析为数组(使用explicitArray = true - 您可以使用其中的多个,并且您只能在JSON中为每个对象分配一个类似的键),您需要一个位置存储属性,这就是$的用途。您可以使用(这是默认设置)强制创建数组或关闭它。使用mergeAttrs,您最终可能得到您想要的结果。

如果这也是一个解决方案,您可以更改attrkey。对于charkey等也是如此。您可以在https://github.com/Leonidas-from-XIV/node-xml2js的GitHub上的自述文件中找到整个配置选项 - 最终可以选择转换为子项的选项。

如果您根本不需要属性,可以设置ignoreAttrs = true。顺便说说;解析器选项作为对象进入解析器构造函数,在您的情况下:new xml2js.Parser({... options});

答案 1 :(得分:0)

这样的库通常会解析所有内容,有时会产生许多你不需要的属性。

我为此目的创建了camaro

这方面的缺点是您必须为希望转换为xml的结构编写自己的模板文件。

const transform = require('camaro')
const fs = require('fs')

const xml = fs.readFileSync('ean.xml', 'utf-8')
const template = {
    cache_key: "/HotelListResponse/cacheKey",
    hotels: ["//HotelSummary", {
        hotel_id: "hotelId",
        name: "name",
        rooms: ["RoomRateDetailsList/RoomRateDetails", {
            rates: ["RateInfos/RateInfo", {
                currency: "ChargeableRateInfo/@currencyCode",
                non_refundable: "nonRefundable",
                price: "ChargeableRateInfo/@total"
            }],
            room_name: "roomDescription",
            room_type_id: "roomTypeCode"
        }]
    }],
    session_id: "/HotelListResponse/customerSessionId"
}

const result = transform(xml, template)

答案 2 :(得分:0)

使用xml2json代替xml2js,它使用特定的密钥将xml精确地转换为json。