我有一个csv文件,我试图根据列数进行拆分。原始文件有大约24000列,我想将其拆分为文件,每个文件具有固定数量的列(比如1000)。我想运行在weka上对各个文件进行功能选择。我在python中有以下代码。
import pandas as pd
import numpy as np
i=0
df=pd.read_csv("glio.csv")
#row_split=int(input("Enter the Row Split: "))
row_split=6000
name ="temp_file_"
ext=".csv"
rows, columns = df.shape
df_temp=df.iloc[:,:row_split]
df_temp.to_csv(name+str(i)+ext)
i=i+1
while(row_split<columns):
df_temp=df.iloc[:,row_split+1:row_split+100]
df_temp.to_csv(name+str(i)+ext)
i=i+1
row_split+=1000
它按预期生成单个文件,但在拆分后,我无法在weka中加载单个文件。我收到以下错误
我是新手,不知道为什么会这样。我在网上找不到答案。如果有人可以解释为什么会发生这种情况以及如何纠正这个
,那将会非常有帮助答案 0 :(得分:0)
首先在to_csv
电话中添加index = False:
df_temp.to_csv(name+str(i)+ext, index=False)
另外,请在某些csv查看器应用程序(例如Excel)中打开csv文件的屏幕截图。