如何检查熊猫文件内容?

时间:2019-04-19 07:19:49

标签: python pandas csv

我的CSV文件有问题。我需要处理sampleFileresultFile。我用标头为CSV编写了整个代码。

让我们说csv看起来(下面文件中的每个空格都是\ t或\ t \ t):

Head
Ver_info
number_Ver
data_source
Data.sam
Number Sample Val1   Val2 Val3
231    a1       a1    b1   c1
231    a2       a2    b2   c2
231    a3       a3    b3   c3
etc.

然后...我的代码选择Ver_info,另存为新变量(以后用作newFileName),然后将数据帧作为所有BELOW标头加载并进行处理。所以我的结果文件看起来是:

231    a1e       a1    b1  
231    a2e       a2    b2  
231    a3e       a3    b3  
etc.

现在,我遇到了没有头文件的问题。

231    a1       a1    b1   c1
231    a2       a2    b2   c2
231    a3       a3    b3   c3

如何在文件加载之前检查(我正在通过pd.read_csv(file, skiprow = num)加载文件,其中num是头文件之前的行数,包括)文件中是否没有头文件和内容? / p>

恢复:一个文件以content + header开头,然后以\ t分隔数据。我有一个过程的代码。另一个文件只有\ t分隔的数据,没有内容和标题。我需要在处理之前进行检查。 而且...内容不是恒定的。 :( 我无法执行以下操作:if 'Head' in line = we have a header

我尝试了dataframe.shape coz,我认为第二个文件中的shape会具有很多cols(第一种情况是,当我加载文件时,我只有一个col),但是在第二种情况下,我也有一个col,coz文件由\ t。但是我无法分离文件firs coz,我遇到了一个错误(第一种文件的前9-12行中有一个col,下一行中的cols很少,但是我得到了错误)

有人知道如何处理吗?

0 个答案:

没有答案