我在我的项目中构建了一个小应用程序,它旨在通过给定的文本并在其前面用#tag提取单词。
当用英语接收文本时,它可以很好地工作,但是当使用阿拉伯语或中文时,它将无法正常工作。任何想法我怎样才能使它适应外语?
在我的model.py中写过
class Article(models.Model):
def _strip_hash_tags(self, ):
return tuple([tag.strip("#") for tag in self.content.split() if tag.startswith("#")])
def save(self, force_insert=False, force_update=False, using=None):
super(Article, self).save(force_insert=force_insert, force_update=force_update, using=using)
# first remove all associatd tags with object
Tag.objects.remove_all_tags(self)
# then, look through content field and insert all tagged words
for tag in self._strip_hash_tags():
Tag.objects.add_tag(self, tag)