Question

我有2个文本文件。第一个包含1000个单词，每个单词都在一个新行中。第二个包含很多句子。我必须找到第二个文件中第一个文件的每个单词的计数，并将结果写入一个新文件。（我必须将此结果文件用于另一段代码）。此代码不打印任何内容，输出文件只包含一些字母。我希望有人能解决它。

from collections import Counter

file=open("c:/python34/tes.txt", encoding="utf-8")
f1=file.read().split()
file2=open("c:/python34/new.txt", encoding="utf-8")
f2=file2.read().split()
c = Counter()
for word in f1:
    for w in f2:
        if word==w:
            c[word] += 1
            print(c)

f3=open("c:/python34/result.txt", "w")
f3.write(str(c))
f3.write(" ")

适用于英语。但我的文件语言是波斯语。

测试文件的一部分：

است گفت كرد طرح سال ميشود سياسي تهران ادامه ايران وجود انجام

新文件的一部分：

دانشگاهخبرگزاريدانشجويانايران，دانشگاهايده

Answer 1

我没有看到你描述的行为。将样本日期编辑到代码中以生成mcve，就像您应该做的那样（并且输出已更改）

from collections import Counter

f1 = '.است گفت كرد طرح سال مي‌شود سياسي تهران ادامه ايران وجود انجام'.split()
f2 ='دانشگاه خبرگزاري دانشجويان ايران ، دانشگاه ايده‌'.split()
c = Counter()
for word in f1:
    for w in f2:
        if word==w:
            c[word] += 1
            print(w)
print(c)

打印

ايران
Counter({'ايران': 1})

编辑：我复制/粘贴了上面的输出，但看起来不对，可能是因为阿拉伯语从右到左的性质。这可能会使用更多的调查。

计算另一个文件中文件的单词数

1 个答案: