我正在创建一个应用程序来生成wiki markup的HTML文档。我认为正则表达式是将标记替换为HTML标记的正确方法。我想出了一个正在运行的正则表达式来查找标记,但我找不到Java API来替换它而保留句子。
回答建议的正则表达式:
--([^-]+)--
(正则表达式--([^-])+--
与Java API的表现不佳。在捕获组中移动+
可以解决问题。)
示例:
--This is strike--
应为<strike>This is strike</strike>
但不应替换This is ---- normal text
或---Triple hyphens---
等案例。
但是,像--striked----also striked--
这样的案例有效。
请只提供Java 6 欢迎任何帮助。提前谢谢。
编辑:根据答案,似乎我可以使用$1
来实现此目的。
答案 0 :(得分:2)
群组ValueError: unknown locale: UTF-8
按发生顺序从1开始编号。
后缀运算符(...)
= 0或更多,*
为1或更多。
+
答案 1 :(得分:0)
在询问我的一位朋友后,我得到了一个答案。
--([^-]+(-[^-]+)*)--
将正常工作并将主题字符串捕获为$1