我正在使用C#编写一个研究编译器,目前正在尝试搜索维基百科。我的问题是来自维基百科的信息在方括号中带有这些数字,例如: [1],[46],[77]。
如何删除所有这些,而不必手动将它们全部放入我已经尝试过的字符串数组中,但其中一些非常高(200 +)。
感谢。
答案 0 :(得分:0)
理论上,您可以使用正则表达式模式,"\\[([^\\s]*)\\]"
理论上应该返回括号和所述括号的内部内容。
// Sample:
var sample = @"Richard was killed fighting Henry Tudor in 1485[1] Following his death, Richard's body was stripped naked and taken to Leicester[2][3]";
var content = Regex.Replace(sample, "\\[([^\\s]*)\\]", String.Empty);
Console.WriteLine(content);
// Output:
Richard was killed fighting Henry Tudor in 1485 Following his death, Richard's body was stripped naked and taken to Leicester
不确定这是否是你所寻求的,但希望它有所帮助。
答案 1 :(得分:0)
这将使用正则表达式从输入字符串中删除[]中的任何内容:
string regex = "(\\[.*\\])";
string output = Regex.Replace(input, regex, string.Empty);