我有来自api的json
转储,这是印地语。首先,我得到了这些json
个文件:
def retrieve_data():
'''Get articles from api and save locally.'''
i = 1
while True:
articles = get_articles(page_no=i)
if not articles or len(articles) < 1:
break
with open('dumps/%d.json' % i, 'w') as ijson:
json.dump(articles, ijson, ensure_ascii=False)
# I also tried
# json.dump(articles, ijson)
i = i+1
现在在我搜索不同的印地语单词时索引后,我得到了混合的结果。
例如:नरेंद् मोदी
是在我的索引文章中出现多次的人的名字。当我搜索नरेंद्
时,我很容易收到所有匹配项,但是当我搜索मोदी
时,我无法获得单个结果。同样的事情发生在不同的印地语单词中,有些人我得到的结果,但对于其他我不是。
我无法理解这里的错误。因为对于英语单词我的嗖嗖搜索工作完美,我没有遇到任何问题。这就是为什么我认为我的蠢叫代码是正确的。