我有一个包含英文字母,印地语字母,希腊符号和数字的列表。我想删除除印地语之外的所有字母。 unicode中的印地语字母范围是u' 09 -u' 097F'。有关印地语字母的详细信息,请访问http://jrgraphix.net/r/Unicode/0900-097F。
输入:
l=['ग','1ए','==क','@','ऊं','abc123','η','θ','abcशि']
for i in l:
print i
期望的输出:
ग
ए
क
ऊं
शि
答案 0 :(得分:5)
要获取字符值,您可以使用ord(char)
buildin函数。
在你的情况下,这样的事情应该有效:
strings = [u'ग',u'1ए',u'==क',u'@',u'ऊं',u'abc123',u'η',u'θ',u'abcशि']
for string in strings:
for char in string:
if ord(u'\u0900') <= ord(char) <= ord(u'\u097F'):
print(char)
{em> Python 2 和 Python 3
可以使用ord(char)
函数