我有一个阿拉伯文本文件,我想知道某个字符串出现的行,因此我使用python编程语言编写了以下代码。
line_position = 0
with open('arwiki_corpus.txt', 'r') as read_obj:
for line in read_obj:
line_position += 1
if thelastline in line:
print(line_position)
print(line)
break
(thelastline)是我要在(arwiki_corpus.txt)中搜索的字符串,其中包含以下内容:
thelastline ='كماشاعاستخدامالرصاصفنصناعةقنواتالمجاريوفيالإنشاءاتالمدنيةوالصناعاتالعسكسسست بالإضافةإلىسهولةالحصولعليه,ورخصثمنه'
问题是,即使我在文本中手动搜索该字符串时,条件(如果line中的lastline)也永远不会返回true
我通过在英文文本文件中搜索英文字符串来测试了相同的代码,并且工作正常,所以我想问题是我正在阿拉伯文本文件中搜索阿拉伯字符串...
我试图用此条件代替条件:
if araby.strip_tatweel(araby.strip_tashkeel(thelastline)) in araby.strip_tatweel(araby.strip_tashkeel(line)):
这将对文本进行一些清理,但仍然无法正常工作。
我该如何解决?