将csv导入到无法识别的数据框对象

时间:2014-11-15 14:40:26

标签: python csv pandas

我从一个文件夹导入了多个csv文件。首先,我创建了文件夹中所有csv文件的列表,然后我将列表的长度提供给我的函数。

csv文件的行长度不同,所以我认为我必须使用readlines。

问题是,当我尝试过滤DataFrame时,无法识别值。

我将它保存到sqlite表中并将其拉入R并显示一个类似于" H"

在r ---" \" H \""

中似乎是这样的

如何防止将这些额外字符添加到我的对象" H"

或者我还有其他问题吗?

x = []
count = 0
while (count < len(filelist) ):
    for file in  filelist:  
        filename = open(filelist[count])
        count = count + 1
        for line in filename.readlines():
            x.append(line.split(','))

df = pd.DataFrame(x)

例如我只是想创建一个面具。但我得到了所有的错误。 DataFrame似乎包含&#34; H&#34;?

data['V1'] == "H"

2 个答案:

答案 0 :(得分:0)

试试这个

df_list =[]
file_list = []
path = 'file_path'
for file in file_list:
    df_name = 'df_%s' %file
    df_list.append(df_name)
    ('df_%s' % file) = pd.read_csv(path+file)

new_df = pd.concat(df_list)

答案 1 :(得分:0)

答案:此代码通过删除引号来解决问题。现在面具有效。

for i, col in enumerate(df.columns):
    df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')