我正在使用pd.concat()
合并多个xlsx文件。我在Excel文件中有7个具有自定义格式的日期列。当我串联文件时,不是保留原始日期,而是将所有日期更改为今天的日期。多谢您的协助。列,包含日期由索引给出。
这是我正在使用的代码:
import csv
import glob
import sys
import pandas as pd
import os
os.chdir(r"path")
all_files = glob.glob(os.path.join(path, "*.xlsx"))
header=['header names']
df = (pd.read_excel(f, sheet_name=0, skiprows=2, usecols='A:DN', sort=False,
header=None, names=header, infer_datetime_format=False,
format='%m/%d/%Y', parse_dates=[0,1,2,3,4,5,6,28],
start='01/01/1987', end='01/01/2019',
converters={'Initial Warrant Call Date':'datetime64[ns]',
'Trade Date':'datetime64[ns]',
'Overallotment Exercise Date':'datetime64[ns]',
'Filing Date':'datetime64[ns]',
'Issue Date':'datetime64[ns]',
'Date Filing Amended':'datetime64[ns]',
'Date Founded':'datetime64[ns]'})
for f in all_files)
concatenated_df = pd.concat(df, ignore_index=True)
concatenated_df.to_csv('merged_ipo.csv', encoding='utf-8', index=False)
输出:串联df的快照。