我在尝试从以下txt文件计算平均薪水和总薪水时遇到问题。
#EMP_NO, EMP_NAME, AGE, POSITION, SALARY, YRS_EMP
001, Peter Smyth, 26, Developer, 29000, 4
002, Samuel Jones, 23, Developer, 24000, 1
003, Laura Stewart, 41, DevOps, 42000, 15
004, Paul Jones, 24, Analyst, 21000, 2
005, Simon Brown, 52, Developer, 53000, 18
006, George Staples, 42, Tester, 42000, 12
007, Greg Throne, 57, DevOps, 50000, 23
008, Aston Bently, 27, Tester, 33000, 5
009, Ben Evans, 32, DevOps, 38000, 2
010, Emma Samson, 23, DevOps, 22000, 1
011, Stephanie Beggs, 43, Tester, 19000, 9
012, Sarah McQuillin, 47, DevOps, 23000, 5
013, Grace Corrigan, 48, Analyst, 44000, 16
014, Simone Mills, 32, DevOps, 32000, 11
015, Martin Montgomery, 28, Analyst, 28000, 3
我什至不知道从哪里开始
答案 0 :(得分:0)
假设您在此处显示的文件名为 myfile.txt (只需确保取消注释第一行)。然后,以下代码将解决您的问题:
import pandas as pd
df = pd.read_csv(myfile_path, sep=',')
average_salaries = df["SALARY"].mean
print(average_salaries)
就像魔术一样。如果您没有安装熊猫,请在您的终端上运行pip install pandas
。
Pandas是专门为数据分析创建的python库。考虑到您的文件基本上是一个csv,它可能是与之正确交互的最佳方法。在我向您展示的情况下,我将文件转换为名为df的dataframe,以便熊猫可以处理它。
在这种情况下,我们使用函数.mean
通过将其列为列表来计算列SALARY
的平均值。 (当然还有很多其他功能)。