所有可能是子弹点(例如“*”)或“破折号”的角色

时间:2010-06-25 18:48:45

标签: regex unicode utf-8 character

这个问题很简单(原谅双关语):

在开始一个段落时,所有字符可以合理地解释为(在盎格鲁 - 撒克逊人口统计中)该段落应该是一个子弹点或“破折号”点。

到目前为止,这是我期望的那些:

子弹

  • Asterisk:“*”,
  • HTML实体⁊:“•”

短跑

  • 短划线:“ - ”
  • en-dash(–):“ - ”
  • em-dash(—):“ - ”

还有其他人吗?

感谢您的阅读。

布赖恩

4 个答案:

答案 0 :(得分:6)

在unicode中有 lot 。怎么样:

  • 黑色左指点:U + 261A☚
  • 黑色右指点:U + 261B☛
  • 白色左指点:U + 261C☜
  • 白色右指点:U +261E☞

只是一个简单的例子。哎呀,有一整个范围专用于各种arrows (2190–21FF),可以很容易地用作子弹点。我想你可以开始浏览unicode code pages - 但是那里有一些很多的角色。我希望你很难找到任何人都可以使用的东西。

答案 1 :(得分:3)

我看到+>#用于表示项目符号。

答案 2 :(得分:1)

即使是普通的窗户,代码页字符如:º+·˙̣·0•▪■□►●○▬─
可以使用 - 特别是如果使用CSS来确定它们的大小和位置。


此外,与子弹点几乎相同,但有序,是大纲表示法:

1.
2.
2.1
2.1.A
2.1.B
etc.

答案 3 :(得分:1)

Dashes的Unicode类别为Pd。从Unicode 5.2开始,这些字符中有21个:

  • U + 002D - HYPHEN-MINUS
  • U + 058A - 亚美尼亚海豚
  • U + 05BE - 希伯来扑克MAQAF
  • U +1400᐀CANADIANSYLLABICS HYPHEN
  • U + 1806᠆MONGOLIAN TODO SOFT HYPHEN
  • U + 2010 - HYPHEN
  • U + 2011 - 不打破HYPHEN
  • U + 2012 - 图DASH
  • U + 2013 - EN DASH
  • U + 2014 - EM DASH
  • U + 2015 - HORIZONTAL BAR
  • U + 2E17⸗双斜面HYPHEN
  • U +2E1A⸚带有DIAERESIS的HYPHEN
  • U + 301C~WAVE DASH
  • U + 3030〰WAVY DASH
  • U +30A0゠KATAKANA-HIRAGANA DOUBLE HYPHEN
  • U +FE31︱垂直EM DASH的演示形式
  • U +FE32︲垂直EN DASH的演示表格
  • U + FE58﹘SMALL EM DASH
  • U + FE63 - 小小的HYMEN-MINUS
  • U + FF0D - FULLWIDTH HYPHEN-MINUS

子弹比其他人提到的要复杂得多。