我有一个txt文件(数据文件),没有任何字段分隔符。我需要一个python / unix脚本,该脚本可以检查每个字段的数据应采用正确的格式并且不应超过长度。 场景:
import pandas as pd
df1=pd.read_fwf(r'C:\Users\msngh\Feeder\dfiles\A.TXT',header=None)
df1[0].str[1:11] # this is showing me date - 01/01/2019 for entire file
样本文件数据:
P07 / 31/2018 001计算机软件开发140017 0.00 580017.78
P07 / 31/2018 001 Accum Amort-Comp Sftw Develop 141017 636479.62 0.00
P07 / 31/2018 001 B类预付服务费150050 0.00 14555.46
现在脚本应该从2:11位置提取数据并检查其日期fmt dd / mm / yyyy,然后从12到21是不同的日期字段,对每个字段进行一些检查。
pd.read_fwf 但不知道如何前进。请帮助