修改Python脚本以处理目录中的所有文件

时间:2018-12-15 04:29:04

标签: python

我已经完成了一些脚本的第1部分,该脚本产生了我想要的输出。非常感谢SO社区和Google。

这是我的代码:

import pandas as pd
files = ('filename_20181006.txt')
df = pd.read_table('filename_20181006.txt', encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output.csv")

我需要每一行都携带文件名的解析值,即“分配日期”列,因此我不确定如何修改它而不丢失它。

所有文件都在同一目录中。他们的名字唯一不同的是日期本身。

编辑

我一直在玩它,这是我在的位置:

import pandas as pd
import glob
files = glob.glob('./*.txt')
df = pd.read_table(files, encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output2.csv")

现在,我收到此错误:无效的文件路径或缓冲区对象类型:这使我认为“ pd.read_table(files,”)部分失败。

0 个答案:

没有答案