希望能对此问题有所了解,我正在使用Pandas尝试清理数据,然后将两个记录合并在一起。代码在下面,它成功地合并了两个文件头,但随后删除了我所有的行。
在合并它们之前,我必须重命名一个文件的列以匹配另一个文件,然后我需要从单元格内容中删除字符串,最后将该列从对象转换为INT。
这是我的第一个程序,因此需要进行很多工作,我知道我可以在2分钟内在EXCEL中完成此操作,但希望长期实现自动化。
谢谢。
import pandas as pd
import os
os.chdir("c:/users/user/desktop/exercises")
fileA = pd.read_csv("./fileA.csv")
fileB = pd.read_csv("./fileB.csv")
fileA.loc[:,'step'].replace(regex=True,inplace=True, to_replace="Case ID Number - 00", value="")
fileA = fileA.rename(columns={'step':'Case Number'})
fileA['Case Number'] = pd.to_numeric(contextor['Case Number'], errors='raise')
print(fileA.info())
#Merge works but then deletes all the table data
MERGE = fileA.merge(fileB,on='Case Number')
MERGE.to_csv('UPDATEDMERGE.csv')