在标签c#之间提取文本

时间:2013-03-11 12:28:21

标签: c# regex string tags

我必须创建一个函数来读取格式为<tag>sometext</tag>的所有标记之间的所有子字符串。 &#39;标签&#39;可以是任何字母数字字符,用户可以输入任意数量的不同标签,但不包含嵌套标签。我必须使用正则表达式... 我做了一些在第一个标签之间打印第一个子串的东西,但是我无法弄清楚如何自动化函数从用户输入字符串的开始到结束工作...... 谢谢!

2 个答案:

答案 0 :(得分:0)

您可以使用后退参考:

<([^>]+)>([^<]*)</(\1)>

(\1)表示它必须是第一组中包含的文字。

我将[^<]*作为内容,但如果您有子元素,则应使用.*

答案 1 :(得分:-1)

试试这个

<[a-zA-Z0-9^>]>*(.*)</[[a-zA-Z0-9^>]*>