当文件标头未满时,我正在尝试使用pandas.read_csv读取csv文件,即只有一些列有名称,其他列为空。
使用.iloc读取数据帧时,我只获得标题没有任何名称的列。
某些列没有名称的原因是列大小是可变的,我没有为每列指定名称。
这是代码,输入文件和输出
的示例dataframe = pandas.read_csv('filename.csv', sep = ",", header = 0)
dataframe = dataframe.iloc[::]
dataset = dataframe.values[:,0:]
输入文件
A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15
数据集输出
dataset = [[1,2,3][5,6,7][9,10,11][13,14,15]]
如何让数据帧使用整个数组(没有标题)?
答案 0 :(得分:0)
我认为你需要.values
才能找回numpy ndarray。
from io import StringIO
csv_file = StringIO("""A B C
3 5 0 1 2 3
3 5 4 5 6 7
3 5 8 9 10 11
3 5 12 13 14 15""")
df = pd.read_csv(csv_file,sep='\s',engine='python')
df.values
输出:
array([[ 1, 2, 3],
[ 5, 6, 7],
[ 9, 10, 11],
[13, 14, 15]])
答案 1 :(得分:0)
加载csv文件时为什么不 skip = 1 ?