Question

我正在尝试搜索HTML文件中的特定字符串。我正在寻找的字符串是

HHA_HG

如果我使用记事本，我可以看到该字符串仅在文件中存在一次。

然而

MatchCollection matches = Regex.Matches(inputString, "HHA_HG");

不返回任何匹配项。我验证inputString包含我想要的字符串。

奇怪的是，如果我删除包含HHA_HG的行之外的所有行，我可以得到匹配。如果我只是在完整文件中搜索HHA_，我可以获得匹配，但没有匹配是HHA_HG。

下划线是否意味着什么特别的东西？

Answer 1

不，它没有。那应该没问题。可能的解释：源或正则表达式模式中是否存在不可见的unicode字符？或者替代“看起来像A但不是A”的unicode字符？基本上，正则表达式模式和文件（在适当的位置）的实际char值是多少？文件中的HHA_HG实际上是否在RTL块中，实际上是GH_AHH？