Question

我有带标签（韩语单词）和计数的文本文件。我想从文本文件中计算所有来自count的数字。但对我来说这是一项非常艰巨的任务。如果我得到一些帮助会很棒......

离）

tag: 있다, count: 61
tag: 맛있다, count: 48
tag: 같다, count: 26
tag: 없다, count: 23
tag: 아니다, count: 20
tag: 좋다, count: 18
tag: 이다, count: 14
tag: 좋아하다, count: 12
tag: 많다, count: 12
tag: 그렇다, count: 11
tag: 유명하다, count: 9
tag: 시원하다, count: 6
tag: 이렇다, count: 6
tag: 멀다, count: 5
tag: 바쁘다, count: 5
tag: 어떻다, count: 5

Answer 1

如果您逐行读取文件，则可以拆分每一行：

counter = 0
line = row.split(" ") # assumes all the lines are the same as you described

然后你有这样的数组： ['tag:', '있다,', 'count:', '61']

现在每个数组都有4个元素，您可以随时选择最后一个元素。

counter += int(line[3])

Answer 2

您可以使用pandas将文本文件读入表格：

import pandas as pd
#read text file, split with regex seperator
df = pd.read_csv("test.txt", sep = ":|,", names = ["tag", "count"], usecols = [1, 3], engine = "python")
print(df)

输出

      tag  count
0      있다     61
1     맛있다     48
2      같다     26
3      없다     23
4     아니다     20
5      좋다     18
6      이다     14
7    좋아하다     12
8      많다     12
9     그렇다     11
10   유명하다      9
11   시원하다      6
12    이렇다      6
13     멀다      5
14    바쁘다      5
15    어떻다      5

汇总列count

中的所有值

print(df["count"].sum())
>>>281

textfiles计数中的python数字

2 个答案: