我从一个文件夹导入了多个csv文件。首先,我创建了文件夹中所有csv文件的列表,然后我将列表的长度提供给我的函数。
csv文件的行长度不同,所以我认为我必须使用readlines。
问题是,当我尝试过滤DataFrame时,无法识别值。
我将它保存到sqlite表中并将其拉入R并显示一个类似于" H"
在r ---" \" H \""
中似乎是这样的如何防止将这些额外字符添加到我的对象" H"
或者我还有其他问题吗?
x = []
count = 0
while (count < len(filelist) ):
for file in filelist:
filename = open(filelist[count])
count = count + 1
for line in filename.readlines():
x.append(line.split(','))
df = pd.DataFrame(x)
例如我只是想创建一个面具。但我得到了所有的错误。 DataFrame似乎包含&#34; H&#34;?
data['V1'] == "H"
答案 0 :(得分:0)
试试这个
df_list =[]
file_list = []
path = 'file_path'
for file in file_list:
df_name = 'df_%s' %file
df_list.append(df_name)
('df_%s' % file) = pd.read_csv(path+file)
new_df = pd.concat(df_list)
答案 1 :(得分:0)
答案:此代码通过删除引号来解决问题。现在面具有效。
for i, col in enumerate(df.columns):
df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')