我正在使用以下代码将特定文件夹中包含的所有CSV文件读取到DataFrame。
import pandas as pd
import glob, os
path = r'C:\myfiles\CSV'
all_files = glob.glob(os.path.join(path, "*.csv"))
df_from_each_file = (pd.read_csv(f) for f in all_files)
concatenated_df = pd.concat(df_from_each_file, ignore_index=True)
以上代码将所有CSV读入一个DF,但是我需要在读取时将列的dtype定义为object
,因为缺少许多列的前导零。例如,必须将列product code
设置为对象。
下面是其中一个CSV的摘要,总共有20多个CSV。
Time Period Product Number
2018_Q1 000123
2018_Q1 000567
2018_Q1 000345
2018_Q1 000853
2018_Q1 000147
2018_Q1 000963
2018_Q1 000852
2018_Q1 000120
2018_Q1 000100
任何人都可以提供的任何帮助将不胜感激。