Question

我从一个文件夹导入了多个csv文件。首先，我创建了文件夹中所有csv文件的列表，然后我将列表的长度提供给我的函数。

csv文件的行长度不同，所以我认为我必须使用readlines。

问题是，当我尝试过滤DataFrame时，无法识别值。

我将它保存到sqlite表中并将其拉入R并显示一个类似于＆＃34; H＆＃34;

在r ---＆＃34; \＆＃34; H \＆＃34;＆＃34;

中似乎是这样的

如何防止将这些额外字符添加到我的对象＆＃34; H＆＃34;

或者我还有其他问题吗？

x = []
count = 0
while (count < len(filelist) ):
    for file in  filelist:  
        filename = open(filelist[count])
        count = count + 1
        for line in filename.readlines():
            x.append(line.split(','))

df = pd.DataFrame(x)

例如我只是想创建一个面具。但我得到了所有的错误。 DataFrame似乎包含＆＃34; H＆＃34;？

data['V1'] == "H"

Answer 1

试试这个

df_list =[]
file_list = []
path = 'file_path'
for file in file_list:
    df_name = 'df_%s' %file
    df_list.append(df_name)
    ('df_%s' % file) = pd.read_csv(path+file)

new_df = pd.concat(df_list)

Answer 2

答案：此代码通过删除引号来解决问题。现在面具有效。

for i, col in enumerate(df.columns):
    df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')

将csv导入到无法识别的数据框对象

2 个答案: