将所有CSV文件读取到DataFrame-列dtype

时间:2019-09-24 08:29:36

标签: python pandas csv

我正在使用以下代码将特定文件夹中包含的所有CSV文件读取到DataFrame。

import pandas as pd
import glob, os   

path = r'C:\myfiles\CSV'    

all_files = glob.glob(os.path.join(path, "*.csv"))     

df_from_each_file = (pd.read_csv(f) for f in all_files)

concatenated_df   = pd.concat(df_from_each_file, ignore_index=True)

以上代码将所有CSV读入一个DF,但是我需要在读取时将列的dtype定义为object,因为缺少许多列的前导零。例如,必须将列product code设置为对象。

下面是其中一个CSV的摘要,总共有20多个CSV。

Time Period Product Number
2018_Q1     000123
2018_Q1     000567
2018_Q1     000345
2018_Q1     000853
2018_Q1     000147
2018_Q1     000963
2018_Q1     000852
2018_Q1     000120
2018_Q1     000100

任何人都可以提供的任何帮助将不胜感激。

0 个答案:

没有答案