Question

我已经完成了一些脚本的第1部分，该脚本产生了我想要的输出。非常感谢SO社区和Google。

这是我的代码：

import pandas as pd
files = ('filename_20181006.txt')
df = pd.read_table('filename_20181006.txt', encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output.csv")

我需要每一行都携带文件名的解析值，即“分配日期”列，因此我不确定如何修改它而不丢失它。

所有文件都在同一目录中。他们的名字唯一不同的是日期本身。

编辑

我一直在玩它，这是我在的位置：

import pandas as pd
import glob
files = glob.glob('./*.txt')
df = pd.read_table(files, encoding='cp1252', sep='^', usecols=(0,1,70))
df['Assign Date'] = files[-12:-4]
df.columns = ['Row Type','Account Number','Assigned Balance','Assign Date']
(df.dropna()).to_csv("output2.csv")

现在，我收到此错误：无效的文件路径或缓冲区对象类型：这使我认为“ pd.read_table（files，”）部分失败。

修改Python脚本以处理目录中的所有文件

0 个答案: