使用Javascript从字符串中解析值

时间:2017-09-11 20:47:44

标签: javascript regex string-parsing

尝试找到从大字符串中提取值的最有效方法。

EXT-X-DATERANGE:ID="PreRoll_Ident_Open",START-DATE="2016-12-14T120000.000z",DURATION=3,X-PlayHeadStart="0.000",X-AdID="AA-1QPN49M9H2112",X-TRANSACTION-VPRN-ID="1486060788",X-TrackingDefault="1",X-TrackingDefaultURI="http,//606ca.v.fwmrm.net/ad/l/1?s=g015&n=394953%3B394953&t=1485791181366184015&f=&r=394953&adid=15914070&reid=5469372&arid=0&auid=&cn=defaultImpression&et=i&_cc=15914070,5469372,,,1485791181,1&tpos=0&iw=&uxnw=394953&uxss=sg579054&uxct=4&metr=1031&init=1&vcid2=394953%3A466c5842-0cce-4a16-9f8b-a428e479b875&cr="s=0&iw=&uxnw=394953&uxss=sg579054&uxct=4&metr=1031&init=1&vcid2=394953%3A466c5842-0cce-4a16-9f8b-a428e479b875&cr="

我以上面为例。 我们的想法是在之前提取所有大写字符串:作为对象键,以及引号之间的所有内容,直到下一个逗号作为其值。然后迭代整个字符串,直到创建该对象。

nonParsed.substring(nonParsed.lastIndexOf("="")+1, nonParsed.lastIndexOf("","));

我把这个概念作为一个开始,但是有些帮助迭代这个并使其更有效率将会受到赞赏。

最终输出类似于 -

{
  'EXT-X-DATERANGE:ID': 'PreRoll_Ident_Open',
  'START-DATE': '2016-12-14T120000.000z',
  'DURATION': '3',
  ...
}

3 个答案:

答案 0 :(得分:2)

看起来唯一混淆可预测模式的属性是DURATION,后跟一个数字。否则,您可以依赖交替="",的天真模式。

您可以执行类似

的操作
str = str.replace(/DURATION=(\d+)/, `DURATION="$1"`);
return str.split('",').reduce((acc, entry) => {
    let key = `'${entry.split('="')[0]}'`;
    let value = `'${entry.split('="')[1]}'`;
    acc[key] = value;
    return acc;
}, {});

然后在最后添加一些逻辑以根据需要对持续时间进行排序。

答案 1 :(得分:1)

看起来你有标题的混合大小写字符串,而不仅仅是大写字母。我会寻找基于=字符的键值对。您可以构造一个正则表达式并使用exec()方法然后迭代并构建您的对象。

var input = 'EXT-X-DATERANGE:ID="PreRoll_Ident_Open",START-DATE="2016-12-14T120000.000z",DURATION=3,X-PlayHeadStart="0.000",X-AdID="AA-1QPN49M9H2112",X-TRANSACTION-VPRN-ID="1486060788",X-TrackingDefault="1",X-TrackingDefaultURI="http,//606ca.v.fwmrm.net/ad/l/1?s=g015&n=394953%3B394953&t=1485791181366184015&f=&r=394953&adid=15914070&reid=5469372&arid=0&auid=&cn=defaultImpression&et=i&_cc=15914070,5469372,,,1485791181,1&tpos=0&iw=&uxnw=394953&uxss=sg579054&uxct=4&metr=1031&init=1&vcid2=394953%3A466c5842-0cce-4a16-9f8b-a428e479b875&cr="s=0&iw=&uxnw=394953&uxss=sg579054&uxct=4&metr=1031&init=1&vcid2=394953%3A466c5842-0cce-4a16-9f8b-a428e479b875&cr='

// Regex looks for any alpha character, colon, or hyphen before a =, then captures anything between the quotes and an optional comma after
var pattern = /([A-Za-z:-]+)="([^"]+)",?/g;

// Iterate the string using exec() and build the object along the way
var match;
var output = {};
while (match = pattern.exec(input)) {
    output[match[1]] = match[2];
}

console.dir(output);

答案 2 :(得分:1)

这是一个可能的解决方案。您在双引号上拆分字符串(这当然假定您在值中没有转义双引号)。然后循环遍历结果数组,将第i个值设置为键,将第i个值设置为该键的值。这将是代码:

strings=nonparsed.split('"');
myObj={};
myObj[strings[0].slice(0,-1)]=strings[1];
for(i=2;i<strings.length;i+=2)myObj[strings[i].slice(1,-1)]=strings[i+1];