我正在使用RegEx来查找大型数据集中某些字符串值的出现频率。这个工作正常,直到我发现有些年份的数据已输入错字,这意味着已经交换了两个字符。编辑数据集以纠正错字是不可行的。因此,是否可以定义一个与字符串匹配的RegEx,而不管其中只有两个字符的索引?
有问题的字符串是:
“gcse / o-level / cse”和“gsce / o-level / cse”
我知道我可以简单地搜索拼写错误后找到的字符,但我想知道是否有一种RegEx方法来处理这种情况,因为我在其他地方找不到任何解决方案,并认为它提出了一个有趣的挑战。
答案 0 :(得分:1)
你可以使用
/g(cs|sc)e\/o-level\/cse/
|
这里的意思是“或”,就像你习惯的那样。