从没有csv扩展名的python中的文本文件计算值

时间:2018-12-03 14:52:35

标签: python string dictionary slice

我在尝试从以下txt文件计算平均薪水和总薪水时遇到问题。

#EMP_NO, EMP_NAME, AGE, POSITION, SALARY, YRS_EMP
 001, Peter Smyth, 26, Developer, 29000, 4
 002, Samuel Jones, 23, Developer, 24000, 1
 003, Laura Stewart, 41, DevOps, 42000, 15
 004, Paul Jones, 24, Analyst, 21000, 2
 005, Simon Brown, 52, Developer, 53000, 18
 006, George Staples, 42, Tester, 42000, 12
 007, Greg Throne, 57, DevOps, 50000, 23
 008, Aston Bently, 27, Tester, 33000, 5
 009, Ben Evans, 32, DevOps, 38000, 2
 010, Emma Samson, 23, DevOps, 22000, 1
 011, Stephanie Beggs, 43, Tester, 19000, 9
 012, Sarah McQuillin, 47, DevOps, 23000, 5
 013, Grace Corrigan, 48, Analyst, 44000, 16
 014, Simone Mills, 32, DevOps, 32000, 11
 015, Martin Montgomery, 28, Analyst, 28000, 3

我什至不知道从哪里开始

1 个答案:

答案 0 :(得分:0)

假设您在此处显示的文件名为 myfile.txt (只需确保取消注释第一行)。然后,以下代码将解决您的问题:

import pandas as pd

df = pd.read_csv(myfile_path, sep=',')

average_salaries = df["SALARY"].mean

print(average_salaries)

就像魔术一样。如果您没有安装熊猫,请在您的终端上运行pip install pandas

Pandas是专门为数据分析创建的python库。考虑到您的文件基本上是一个csv,它可能是与之正确交互的最佳方法。在我向您展示的情况下,我将文件转换为名为df的dataframe,以便熊猫可以处理它。

在这种情况下,我们使用函数.mean通过将其列为列表来计算列SALARY的平均值。 (当然还有很多其他功能)。