使用CSV / Excel / SPSS文件使用熊猫创建表/报告

时间:2018-07-25 09:51:06

标签: python excel pandas csv spss

我需要为CSV或Excel或SPSSfile创建表或数据列表,该表具有100个被调查者,其中数据文件中有56个变量,仅使用pandas或任何其他使用Python的库,在尝试此方法时,请您帮帮我吧,无法创建包含两个以上变量的表。

我使用pandas库来尝试上述要求。

我需要创建一个Excel文件,该文件在行Gender / Age下具有单独的表,在列中具有其他问题。

Column1 Column2 Column3 Column4 Column5 Column6 Column7 Column8 Column9 Column10    Column11    Column12
Question No.    Code            Total                       RQ2 
                Total   Male    Female  18-24   25-30   31-35   Yes No
Gender  Base                                        
    1       Male                                
    2       Female                              

Age Base                                        
    1       18 or below                             
    2       18-24 yrs                               
    3       25-30 yrs                               
    4       31-35 yrs                               
    5       36-40 yrs                               
    6       41 or above                             
    99      Refuse to answer                                
            Mean                        

1 个答案:

答案 0 :(得分:0)

我已经为上述请求尝试了以下代码。

  

将熊猫作为pd df = pd.read_excel(“ Data.xlsx”)

     

print(df)

     

Gender = pd.crosstab(df.Gender,[df.Gender,df.AgeDummy,df.RQ2])

     

Age = pd.crosstab(df.AgeDummy,[df.Gender,df.AgeDummy,df.RQ2])

     

打印(性别)打印(年龄)

     

Gender.to_excel(“ DataTabulation.xlsx”,sheet_name =“ Sheet1”)   Age.to_excel(“ DataTabulation.xlsx”,sheet_name =“ Sheet1”)

下面是我得到的结果。

  

性别1 2 AgeDummy 3 4 5 6 7 8 3 4 5 6   RQ2 2 2 2 2 2 2 2 2 2 2 AgeDummy 3 18 0 0 0 0 0 1 0 0 0   4 0 31 0 0 0 0 0 3 0 0 5 0 0 15 0 0 0 0 0 3 0 6 0 0 0 12 0 0 0 0 0 2   7 0 0 0 0 8 0 0 0 0 0 8 0 0 0 0 0 7 0 0 0 0

这是不正确的,我知道“ pd.crosstab”不是我可以使用的正确语法,但是由于无法找出要使用的语法,因此我无法弄清楚应该使用哪种语法在Google上的正确答案,因为我在列中需要多个变量,而不是合并变量。

此外,我如何才能将在程序中创建的变量(性别和年龄)都保存在同一张纸中,一个又一个地保存,因为上面的代码仅保存最后一个调用的变量,并覆盖前一个变量。 / p>