我有带标签(韩语单词)和计数的文本文件。 我想从文本文件中计算所有来自count的数字。 但对我来说这是一项非常艰巨的任务。 如果我得到一些帮助会很棒......
离)
tag: 있다, count: 61
tag: 맛있다, count: 48
tag: 같다, count: 26
tag: 없다, count: 23
tag: 아니다, count: 20
tag: 좋다, count: 18
tag: 이다, count: 14
tag: 좋아하다, count: 12
tag: 많다, count: 12
tag: 그렇다, count: 11
tag: 유명하다, count: 9
tag: 시원하다, count: 6
tag: 이렇다, count: 6
tag: 멀다, count: 5
tag: 바쁘다, count: 5
tag: 어떻다, count: 5
答案 0 :(得分:1)
如果您逐行读取文件,则可以拆分每一行:
counter = 0
line = row.split(" ") # assumes all the lines are the same as you described
然后你有这样的数组:
['tag:', '있다,', 'count:', '61']
现在每个数组都有4个元素,您可以随时选择最后一个元素。
counter += int(line[3])
答案 1 :(得分:0)
您可以使用pandas
将文本文件读入表格:
import pandas as pd
#read text file, split with regex seperator
df = pd.read_csv("test.txt", sep = ":|,", names = ["tag", "count"], usecols = [1, 3], engine = "python")
print(df)
输出
tag count
0 있다 61
1 맛있다 48
2 같다 26
3 없다 23
4 아니다 20
5 좋다 18
6 이다 14
7 좋아하다 12
8 많다 12
9 그렇다 11
10 유명하다 9
11 시원하다 6
12 이렇다 6
13 멀다 5
14 바쁘다 5
15 어떻다 5
汇总列count
print(df["count"].sum())
>>>281