我有一个没有colums名称的python数据框。它有超过650列的名称,我将这些列名称放在一个单独的文件中。我的问题是如何从单独的文件中将列名称附加到数据框。在此先感谢.Below是我尝试的代码。请帮助。(Columns_Names是文件的名称,其中所有650个变量名用逗号分隔,每个变量名都用引号)
答案 0 :(得分:0)
更改#1 - 似乎每行都有多个列名。在这种情况下,您应该使用list.extend
-
column_names.extend(line.strip().split(','))
哪个增长原始列表。 append
会在列表中插入一个列表,这不是您需要的。这是一个小例子 -
>>> c = [1, 2, 3]
>>> c.extend([4, 5, 6])
>>> c
[1, 2, 3, 4, 5, 6]
将此与 -
对比>>> c = [1, 2, 3]
>>> c.append([4, 5, 6])
>>> c
[1, 2, 3, [4, 5, 6]]
更改#2 - 您可以使用read_csv
中的names
属性并将column_names
传递给它 -
names
:类似于数组,默认None
要使用的列名列表。如果是文件 不包含标题行,那么您应该明确传递header=None
。
df = pd.read_csv(filename, sep="\x01", header=None, names=column_names, nrows=100)