我的CSV文件有问题。我需要处理sampleFile
至resultFile
。我用标头为CSV编写了整个代码。
让我们说csv看起来(下面文件中的每个空格都是\ t或\ t \ t):
Head
Ver_info
number_Ver
data_source
Data.sam
Number Sample Val1 Val2 Val3
231 a1 a1 b1 c1
231 a2 a2 b2 c2
231 a3 a3 b3 c3
etc.
然后...我的代码选择Ver_info,另存为新变量(以后用作newFileName),然后将数据帧作为所有BELOW标头加载并进行处理。所以我的结果文件看起来是:
231 a1e a1 b1
231 a2e a2 b2
231 a3e a3 b3
etc.
现在,我遇到了没有头文件的问题。
231 a1 a1 b1 c1
231 a2 a2 b2 c2
231 a3 a3 b3 c3
如何在文件加载之前检查(我正在通过pd.read_csv(file, skiprow = num)
加载文件,其中num
是头文件之前的行数,包括)文件中是否没有头文件和内容? / p>
恢复:一个文件以content + header开头,然后以\ t分隔数据。我有一个过程的代码。另一个文件只有\ t分隔的数据,没有内容和标题。我需要在处理之前进行检查。
而且...内容不是恒定的。 :(
我无法执行以下操作:if 'Head' in line = we have a header
我尝试了dataframe.shape coz,我认为第二个文件中的shape会具有很多cols(第一种情况是,当我加载文件时,我只有一个col),但是在第二种情况下,我也有一个col,coz文件由\ t。但是我无法分离文件firs coz,我遇到了一个错误(第一种文件的前9-12行中有一个col,下一行中的cols很少,但是我得到了错误)
有人知道如何处理吗?