textfiles计数中的python数字

时间:2018-05-02 08:51:43

标签: python text-files

我有带标签(韩语单词)和计数的文本文件。 我想从文本文件中计算所有来自count的数字。 但对我来说这是一项非常艰巨的任务。 如果我得到一些帮助会很棒......

离)

tag: 있다, count: 61
tag: 맛있다, count: 48
tag: 같다, count: 26
tag: 없다, count: 23
tag: 아니다, count: 20
tag: 좋다, count: 18
tag: 이다, count: 14
tag: 좋아하다, count: 12
tag: 많다, count: 12
tag: 그렇다, count: 11
tag: 유명하다, count: 9
tag: 시원하다, count: 6
tag: 이렇다, count: 6
tag: 멀다, count: 5
tag: 바쁘다, count: 5
tag: 어떻다, count: 5

2 个答案:

答案 0 :(得分:1)

如果您逐行读取文件,则可以拆分每一行:

counter = 0
line = row.split(" ") # assumes all the lines are the same as you described

然后你有这样的数组: ['tag:', '있다,', 'count:', '61']

现在每个数组都有4个元素,您可以随时选择最后一个元素。

counter += int(line[3])

答案 1 :(得分:0)

您可以使用pandas将文本文件读入表格:

import pandas as pd
#read text file, split with regex seperator
df = pd.read_csv("test.txt", sep = ":|,", names = ["tag", "count"], usecols = [1, 3], engine = "python")
print(df)

输出

      tag  count
0      있다     61
1     맛있다     48
2      같다     26
3      없다     23
4     아니다     20
5      좋다     18
6      이다     14
7    좋아하다     12
8      많다     12
9     그렇다     11
10   유명하다      9
11   시원하다      6
12    이렇다      6
13     멀다      5
14    바쁘다      5
15    어떻다      5

汇总列count

中的所有值
print(df["count"].sum())
>>>281