如何使用正则表达式存储文档中所有出现的某些单词?

时间:2014-03-13 19:25:23

标签: javascript regex

我是一名JavaScript开发人员,当他看到正则表达式时,他的膝盖会变弱。

但是现在,我正在研究一个似乎需要它的副项目。

我想创建一系列重要单词' (其中大约有250个),然后扫描一个巨大的文档,查找并存储每个重要单词'用于分析和进一步操作。

我不知道从哪里开始(或谷歌什么)当谈到正则表达式部分时,我也不知道我想要做的事情所需的专业知识。

如果我能得到重要的话语'单独进入阵列,我知道该怎么做。这是导致我感到困惑的步骤。

非常感谢任何基本建议或指示。

谢谢!

1 个答案:

答案 0 :(得分:1)

做这样的事情怎么样?

var list = ['test', 'west', 'pest', 'nest'], results = {},
    string = 'pesty test for the pest from the west test';
for (var i=0, l=list.length; i<l; i++) {
    var match = string.match(RegExp('\\b' + list[i] + '\\b', 'gi'));
    results[list[i]] = (match !== null) ? match.length : 0;
}
// results = {test: 2, west: 1, pest: 1, nest: 0}