我在wiki中抓住(使用我的脚本)知名人物生物。并注意到一些数据有这条线:
HIDDEN ERROR:无法识别“配偶”的使用
HIDDEN ERROR:无法识别“儿童”的使用情况
其他生物有这个:
HIDDEN ERROR:未确认“配偶”的使用HIDDEN错误:用法 “孩子”未被识别HIDDEN ERROR:“签名”的用法是 未被认可的HIDDEN ERROR:“death_cause”的用法不是 已确认HIDDEN错误:“父母”的使用未被承认HIDDEN 错误:无法识别“resting_place”的使用
我在做string.replace()。
var start = oldString.indexOf("HIDDEN ERROR");
var end = oldString.indexOf("not recognized");
var toRemove = oldString.substring(start, end);
var newString = oldString.replace(toRemove, ""));
但无法摆脱不必要的线条。删除这些行的最佳方法是什么?
我使用mongodb保存数据。
提前致谢。
答案 0 :(得分:0)
我建议使用正则表达式删除这些子字符串:
/HIDDEN\s+ERROR:\s+Usage\s+of\s+"[^"]*"\s+is\s+not\s+recognized/g
请参阅regex demo。
请注意,所有文字空间都与{em}匹配一个或多个空白字符,包括换行符和制表符。由于\s+
是否定字符类,因此[^"]*
匹配零个或多个"
以外的符号。
[^...]