我需要找到韩文字符的成分。例如。我想在한中找到ㅏ。有没有办法用Perl兼容的正则表达式做到这一点?
答案 0 :(得分:1)
使用Unicode block \p{InHangul_Compatibility_Jamo}
(U + 3130 - U + 318F)。
Python 3.x示例(使用第三方regex
模块):
>>> import regex
>>> regex.findall(r'\p{InHangul_Compatibility_Jamo}', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']
>>> regex.findall(r'[\u3130-\u318f]', '한ㅎㅏㄴ글')
['ㅎ', 'ㅏ', 'ㄴ']