我正在编写一个使用正则表达式提取段落中的信息并将其存储在对象中的Web scraper。然后我将对象添加到数组中。这是我的完整代码:
function scrapeCourseData(htmlString) {
// scrapes a specific department's course list
var tempArr = [];
console.log(tempArr); // outputs '[]'
$ = cheerio.load(htmlString);
// #coursestextcontainer contains the actual information for every single course listed in a department
$('#coursestextcontainer').find('.courseblock').each(function(i, elem) {
// finds all divs of type courseblock, iterates though each of them,
// extracting course information from children.
console.log('courseblock ' + (i + 1));
var courseText = $('strong', '.courseblocktitle', elem).text(); // Gets the text that will be parsed
var regex = /([A-Z]{4}\s[A-Z]{1,2}\d{4})\s(.*?)(?:\.*)(\d{1,2}(?:\.?|-?)\d{0,2}\spoints?)/g;
var regexGroups = Object.freeze({
NUMBER: 1,
NAME: 2,
CREDITS: 3
});
var match, course;
while ((match = regex.exec(courseText)) !== null) { // when regex.exec returns null, no more matches, and loop stops.
course = {
number: match[regexGroups.NUMBER],
name: match[regexGroups.NAME],
credits: match[regexGroups.CREDITS]
};
tempArr.push(course); // doesn't work-- result is array full of 'null'
console.log(course); // but this outputs as a valid object, e.g. { number: 'AFAS W3030'... }
}
});
console.log("Complete tempArr: " + tempArr); // outputs [object Object],[object Object],[object Object], etc.
for (var j of tempArr) {
dataJSONObject.push(tempArr[j]);
console.log('\ntempArray at ' + j + ': ' + tempArr[j]); // outputs [object Object]: undefined
}
console.log('\n');
}
当我首先将tempArr
定义为[]
并将其输出到控制台时,我得到了预期的结果[]
。
我从正则表达式匹配形成的对象也在运行时按预期有效。
但是,当我尝试将这些对象推送到tempArr
,然后打印tempArr
时,它会输出为undefined
。
我一直在讨论其他stackoverflow问题,我很确定我的问题是,当我向tempArr
推送时,我在其范围之外这样做。我已经尝试在我声明tempArr
的地方移动(例如,将其置于其函数之外以使其成为全局),但在推送之后我仍然得到undefined
。我错过了什么?
答案 0 :(得分:0)
你正在推入数组的对象就在那里,你只是错误地读出数组。 for...of
循环不会将索引值放在您提供的变量中,而是将 值 。这解释了为什么tempArr[j]
是undefined
。
将for...of
循环更改为:
for (var j of tempArr) {
dataJSONObject.push(j);
console.log('\ntempArray: ' + j);
}
另外,将一个数组的所有元素放入另一个数组的另一种方法是使用spread syntax:
dataJSONObject.push(...tempArr);