解析博客帖子的正确方法是什么?

时间:2011-01-17 08:47:03

标签: regex parsing

需要指导.... 我正在尝试写一个个人博客。 邮政输入的标准结构是什么。 我正在尝试这样的格式:

This is the simple text
And I am [b] bold text[/b].
This is the code part:
[code lang=java]
public static void main (String args[]) {
   System.out.println("Hello World!");
}
[/code]

这是在数据库中存储帖子的正确方法吗?

解析这种帖子的正确方法是什么? 我应该使用正则表达式来解析这个或者还有另一个标准。 如果上述格式不是正确的存储方式,那么可能是什么?

由于

3 个答案:

答案 0 :(得分:2)

在我看来,您正在寻找类似BBCode

的内容

看一下链接,有几个库可以做到这一点。一个例子(来自维基百科):

免责声明:我自己未经过测试

另请查看此问题:Java BBCode library

修改其他要点

  • 根据我的经验,BBCode对于写博客来说太弱了,而且它的语法有点烦人
  • 我建议选择Markdown - 与Stackoverflow使用相同的语法,甚至是像TinyMCE这样的覆盖文本编辑器 - 取决于你要找的东西。
  • 最好使用一种现有的文本格式,就像您要迁移一样 对于其他系统的内容,为此目的更容易找到过滤器。

答案 1 :(得分:1)

您是否考虑使用现有的方言,如markdowntextile? 两者在支持的标记方面功能丰富,实现以多种语言提供,适用于markdowntextile


[1]:http://daringfireball.net/projects/markdown/

[2]:http://www.textism.com/tools/textile/

[3]:http://en.wikipedia.org/wiki/Markdown#Alternate_implementations

[4]:http://www.oreillynet.com/onlamp/blog/2007/05/praising_textile_1.html

答案 2 :(得分:0)

XML可能是存储帖子主体的最佳格式,并且有许多用于解析它的标准库。