我可以搜索分解形式的韩文吗?

时间:2014-01-13 09:58:18

标签: regex

我需要找到韩文字符的成分。例如。我想在한中找到ㅏ。有没有办法用Perl兼容的正则表达式做到这一点?

1 个答案:

答案 0 :(得分:1)

使用Unicode block \p{InHangul_Compatibility_Jamo}(U + 3130 - U + 318F)。

Python 3.x示例(使用第三方regex模块):

>>> import regex
>>> regex.findall(r'\p{InHangul_Compatibility_Jamo}', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']
>>> regex.findall(r'[\u3130-\u318f]', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']