Question

我有一个csv文件，我试图根据列数进行拆分。原始文件有大约24000列，我想将其拆分为文件，每个文件具有固定数量的列（比如1000）。我想运行在weka上对各个文件进行功能选择。我在python中有以下代码。

import pandas as pd
import numpy as np

i=0
df=pd.read_csv("glio.csv")
#row_split=int(input("Enter the Row Split: "))
row_split=6000
name ="temp_file_"
ext=".csv"
rows, columns = df.shape
df_temp=df.iloc[:,:row_split]
df_temp.to_csv(name+str(i)+ext)
i=i+1
while(row_split<columns):
    df_temp=df.iloc[:,row_split+1:row_split+100]
    df_temp.to_csv(name+str(i)+ext)
    i=i+1
    row_split+=1000

它按预期生成单个文件，但在拆分后，我无法在weka中加载单个文件。我收到以下错误

我是新手，不知道为什么会这样。我在网上找不到答案。如果有人可以解释为什么会发生这种情况以及如何纠正这个

，那将会非常有帮助

Answer 1

首先在to_csv电话中添加index = False：

df_temp.to_csv(name+str(i)+ext, index=False)

另外，请在某些csv查看器应用程序（例如Excel）中打开csv文件的屏幕截图。

根据列拆分csv文件

1 个答案: