我正在尝试做一项有趣的任务,目前不知道该怎么做。 我有一个wiki页面(例如:https://en.wikipedia.org/wiki/Moldova),我想将此页面中的每个单词保存到一个数组中。此外,我将需要解析此数组以提取一些特定的单词。
有人可以给我一个提示如何将文字中的单词保存到数组中。 我该如何解决这个问题: - 为每个单词删除标点符号,如。()“'等。 - 如果单词是html标签,请不要存储它。
谢谢。
答案 0 :(得分:3)
通过使用split()
方法,它用于将字符串拆分为子字符串数组,并返回新数组。阅读更多相关信息here。
var text="your text";
var punctRE = /[\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&()*+,\-.\/:;<=>?@\[\]^_`{|}~]/g;
text.replace(punctRE, ''); // Strip all punctuation from the string.
var myArray=text.split(" "); // Pass an empty space as a separator.