在Python的阿拉伯文本文件中查找阿拉伯字符串

时间:2020-04-08 13:37:39

标签: python arabic

我有一个阿拉伯文本文件,我想知道某个字符串出现的行,因此我使用python编程语言编写了以下代码。

 line_position = 0
    with open('arwiki_corpus.txt', 'r') as read_obj:
        for line in read_obj:
            line_position += 1
            if thelastline in line:
                print(line_position)
                print(line)
                break

(thelastline)是我要在(arwiki_corpus.txt)中搜索的字符串,其中包含以下内容:

thelastline ='كماشاعاستخدامالرصاصفنصناعةقنواتالمجاريوفيالإنشاءاتالمدنيةوالصناعاتالعسكسسست بالإضافةإلىسهولةالحصولعليه,ورخصثمنه'

问题是,即使我在文本中手动搜索该字符串时,条件(如果line中的lastline)也永远不会返回true

我通过在英文文本文件中搜索英文字符串来测试了相同的代码,并且工作正常,所以我想问题是我正在阿拉伯文本文件中搜索阿拉伯字符串...

我试图用此条件代替条件:

 if araby.strip_tatweel(araby.strip_tashkeel(thelastline)) in araby.strip_tatweel(araby.strip_tashkeel(line)):

这将对文本进行一些清理,但仍然无法正常工作。

我该如何解决?

0 个答案:

没有答案