如何编写正则表达式将mark转换为HTML?例如,您可以输入以下内容:
This would be *italicized* text and this would be **bold** text
然后需要将其转换为:
This would be <em>italicized</em> text and this would be <strong>bold</strong> text
非常类似于stackoverflow使用的标记向下编辑控件。
澄清
对于它的价值,我正在使用C#。此外,这些是我想要允许的唯一真实标签/降价。转换的文本量将少于300个字符左右。
答案 0 :(得分:6)
最好的方法是找到一个版本的Markdown库移植到你正在使用的任何语言(你没有在你的问题中指定)。
既然您已经澄清了您只想处理STRONG和EM,并且您正在使用C#,我建议您查看Markdown.NET以了解这些标记是如何实现的。如您所见,它实际上是两个表达式。这是代码:
private string DoItalicsAndBold (string text)
{
// <strong> must go first:
text = Regex.Replace (text, @"(\*\*|__) (?=\S) (.+?[*_]*) (?<=\S) \1",
new MatchEvaluator (BoldEvaluator),
RegexOptions.IgnorePatternWhitespace | RegexOptions.Singleline);
// Then <em>:
text = Regex.Replace (text, @"(\*|_) (?=\S) (.+?) (?<=\S) \1",
new MatchEvaluator (ItalicsEvaluator),
RegexOptions.IgnorePatternWhitespace | RegexOptions.Singleline);
return text;
}
private string ItalicsEvaluator (Match match)
{
return string.Format ("<em>{0}</em>", match.Groups[2].Value);
}
private string BoldEvaluator (Match match)
{
return string.Format ("<strong>{0}</strong>", match.Groups[2].Value);
}
答案 1 :(得分:5)
单个正则表达式不会。每个文本标记都有自己的html翻译器。更好地了解现有转换器的实现方式,以了解其工作原理。
答案 2 :(得分:1)
我不知道C#具体,但在perl中它将是:
S /
\ * \ *(。*?)\ * \ * /
\&LT;粗体&GT; $ 1 \&LT; /粗体&/克
S /
\ *(。*?)\ * /
\&LT; EM&GT; $ 1 \&LT; / EM&/克
答案 3 :(得分:0)