无法在嗖嗖声中搜索非英语(印地语)单词?

时间:2016-04-06 07:59:39

标签: python json python-3.x whoosh

我有来自api的json转储,这是印地语。首先,我得到了这些json个文件:

def retrieve_data():
    '''Get articles from api and save locally.'''
    i = 1
    while True:
        articles = get_articles(page_no=i)
        if not articles or len(articles) < 1:
            break
        with open('dumps/%d.json' % i, 'w') as ijson:
            json.dump(articles, ijson, ensure_ascii=False)
            # I also tried
            # json.dump(articles, ijson)
        i = i+1

现在在我搜索不同的印地语单词时索引后,我得到了混合的结果。

例如:नरेंद् मोदी是在我的索引文章中出现多次的人的名字。当我搜索नरेंद्时,我很容易收到所有匹配项,但是当我搜索मोदी时,我无法获得单个结果。同样的事情发生在不同的印地语单词中,有些人我得到的结果,但对于其他我不是。

我无法理解这里的错误。因为对于英语单词我的嗖嗖搜索工作完美,我没有遇到任何问题。这就是为什么我认为我的蠢叫代码是正确的。

0 个答案:

没有答案