是否有一种简单的方法可以检测Python 3中字符串使用的书写系统?
例如:
答案 0 :(得分:5)
Heres one liner(Python 3.X) -
import unicodedata
langname = lambda x : unicodedata.name(x[0]).split(' ')[0]
输出 -
>>> langname('Yamamoto')
'LATIN'
>>> langname('やまもと')
'HIRAGANA'
答案 1 :(得分:3)
快速谷歌搜索放弃了这个:alphabet-detection。
您可以将其用作文档说明:
>>> from alphabet_detector import AlphabetDetector
>>> ad = AlphabetDetector()
>>> ad.detect_alphabet(u'Cyrillic and кириллический')
{'CYRILLIC', 'LATIN'}