附加多个CSV文件并使用python中的文件名创建一个新列

时间:2019-11-14 09:49:48

标签: python pandas csv dataframe

我正在尝试使用pandas库,如果有可能将文件名作为列名 例如,我的文件名带有日期。

stock_2019-10-11.csv,
stock_2019-11-11.csv.

我想用文件名创建2个不同的列并获取附加值 我希望得到一个CSV文件,例如:

   coulmns-primary_key, article_numerber,stock_2019-10-11,stock_2019-11-11

data-0   101,201,4,2
data-1   102,301,5,2

与上面类似,新列的值来自合并的CSV。

import pandas as pd
import glob
import os
import sys
import csv

data = [] # pd.concat takes a list of dataframes
for csv in globbed_files(my directiry of files):
    frame = pd.read_csv(csv,encoding='utf_16',error_bad_lines=False,index_col=False)
    frame['filename'] = os.path.basename(csv)
    data.append(frame)

frame1 = pd.concat(data, ignore_index=True

1 个答案:

答案 0 :(得分:0)

首先将文件名作为列名添加到特定文件,然后将每个文件添加到dataframe.write dataframe到csv (考虑到每个文件都有1列。请根据您的列自定义列标题)

import pandas as pd

df=pd.DataFrame()
filenames=["C:/Users/sghungurde/Documents/server2.csv","C:/Users/sghungurde/Documents/server3.csv"]
i=0
while(i<len(filenames)):
    extracting filename from filepath 
    c1= (filenames[i].split("/")[4]).split(".")[0]
    reading csv file and assigning column name to header
    f1=pd.read_csv(filenames[i],names=[c1])
    adding file column to dataframe
    df[c1]=f1[c1]
    i+=1

print(df)
writing final df merging result to csv
df.to_csv("C:/Users/sghungurde/Documents/merge.csv",index=False)

输出

     server2       server3
 209.10.31.50  609.10.31.50
 204.12.31.53  704.12.31.53
 203.12.31.53  903.12.31.53
 102.71.99.13  102.71.99.13