使用pandas.read_csv读取部分标题CSV时出现问题

时间:2017-08-21 05:11:40

标签: python pandas csv

当文件标头未满时,我正在尝试使用pandas.read_csv读取csv文件,即只有一些列有名称,其他列为空。
使用.iloc读取数据帧时,我只获得标题没有任何名称的列。 某些列没有名称的原因是列大小是可变的,我没有为每列指定名称。

这是代码,输入文件和输出

的示例
dataframe = pandas.read_csv('filename.csv', sep = ",", header = 0)
dataframe = dataframe.iloc[::]
dataset = dataframe.values[:,0:]

输入文件

A B C           
3 5 0      1    2   3

3   5   4      5    6   7

3   5   8      9    10  11

3   5   12     13   14  15

数据集输出

dataset = [[1,2,3][5,6,7][9,10,11][13,14,15]]

如何让数据帧使用整个数组(没有标题)?

2 个答案:

答案 0 :(得分:0)

我认为你需要.values才能找回numpy ndarray。

from io import StringIO

csv_file = StringIO("""A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15""")

df = pd.read_csv(csv_file,sep='\s',engine='python')
df.values

输出:

array([[ 1,  2,  3],
       [ 5,  6,  7],
       [ 9, 10, 11],
       [13, 14, 15]])

答案 1 :(得分:0)

加载csv文件时为什么不 skip = 1