我正在尝试使用python提取特定数据。我有1个月的数据,其中包括在1个月的时间内有多少个工作失败,并带有提到的返回码。
我有30个excel文件,到目前为止,我已经使用以下代码将数据加载到数据框中:
import glob2
import os
import pandas as pd
def concatenate(indir="C:\\Users\\hp",outfile="C:\\Users\\hp\\new1.csv"):
os.chdir(indir)
filelist = glob2.glob("*.csv")
dfList=[]
for f in filelist:
print(f)
df = pd.read_csv(f)
dfList.append(df)
concatDf = pd.concat(dfList,axis=0)
b = concatDf[['JOB NAME' , ' RC ']]
我已经提取了必填列,并且必须对其进行操作,这样我才能在1个月的数据中知道有多少个工作因相同的原因失败了
输入:
STATUS JOB NAME RC DATE TIME
R ABCDEFGH U0900 18163 19:53
X SSTUFGHI C0001 18164 2:04
R LMNOPQRS SB37 18164 2:41
R ABCDEFGH U0900 18164 3:36
需要O / P:
JOB NAME RC
ABCDEFGH U0900
ABCDEFGH U0900
我不明白如何比较这两个值并获得上述o / p。请帮助我,我对python还是很陌生