我已经完成了一些脚本的第1部分,该脚本产生了我想要的输出。非常感谢SO社区和Google。
这是我的代码:
import pandas as pd
files = ('filename_20181006.txt')
df = pd.read_table('filename_20181006.txt', encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output.csv")
我需要每一行都携带文件名的解析值,即“分配日期”列,因此我不确定如何修改它而不丢失它。
所有文件都在同一目录中。他们的名字唯一不同的是日期本身。
编辑
我一直在玩它,这是我在的位置:
import pandas as pd
import glob
files = glob.glob('./*.txt')
df = pd.read_table(files, encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output2.csv")
现在,我收到此错误:无效的文件路径或缓冲区对象类型:这使我认为“ pd.read_table(files,”)部分失败。