一种识别希伯来语标点符号的方法? C#

时间:2012-12-07 05:05:35

标签: c# punctuation

最近,我想到了是否有可能使用C#识别希伯来语中的单词标点符号。 希伯来语中有一些标点符号,例如:

יוּעָדוּ

当然,通常我们不会标记单词,所以它应该看起来像:

יועדו

有没有办法使用C#识别单词的标点符号?

1 个答案:

答案 0 :(得分:1)

在Python中,序列解析如下:

>>> a = unicode('יוּעָדוּ', 'utf-8')
>>> b = unicode('יועדו', 'utf-8')
>>> a
u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc'
>>> b
u'\u05d9\u05d5      \u05e2      \u05d3\u05d5'

(我添加了空格以使事情变得更清楚。)

您可以清楚地看到标点符号突出显示。寻找这些的C#正则表达式可能是您想要的方向。