print（df）

Question

我需要为CSV或Excel或SPSSfile创建表或数据列表，该表具有100个被调查者，其中数据文件中有56个变量，仅使用pandas或任何其他使用Python的库，在尝试此方法时，请您帮帮我吧，无法创建包含两个以上变量的表。

我使用pandas库来尝试上述要求。

我需要创建一个Excel文件，该文件在行Gender / Age下具有单独的表，在列中具有其他问题。

Column1 Column2 Column3 Column4 Column5 Column6 Column7 Column8 Column9 Column10    Column11    Column12
Question No.    Code            Total                       RQ2 
                Total   Male    Female  18-24   25-30   31-35   Yes No
Gender  Base                                        
    1       Male                                
    2       Female                              

Age Base                                        
    1       18 or below                             
    2       18-24 yrs                               
    3       25-30 yrs                               
    4       31-35 yrs                               
    5       36-40 yrs                               
    6       41 or above                             
    99      Refuse to answer                                
            Mean

Answer 1

我已经为上述请求尝试了以下代码。

将熊猫作为pd df = pd.read_excel（“ Data.xlsx”）

print（df）

Gender = pd.crosstab（df.Gender，[df.Gender，df.AgeDummy，df.RQ2]）

Age = pd.crosstab（df.AgeDummy，[df.Gender，df.AgeDummy，df.RQ2]）

打印（性别）打印（年龄）

Gender.to_excel（“ DataTabulation.xlsx”，sheet_name =“ Sheet1”）   Age.to_excel（“ DataTabulation.xlsx”，sheet_name =“ Sheet1”）

下面是我得到的结果。

性别1 2 AgeDummy 3 4 5 6 7 8 3 4 5 6 RQ2 2 2 2 2 2 2 2 2 2 2 AgeDummy 3 18 0 0 0 0 0 1 0 0 0 4 0 31 0 0 0 0 0 3 0 0 5 0 0 15 0 0 0 0 0 3 0 6 0 0 0 12 0 0 0 0 0 2 7 0 0 0 0 8 0 0 0 0 0 8 0 0 0 0 0 7 0 0 0 0

这是不正确的，我知道“ pd.crosstab”不是我可以使用的正确语法，但是由于无法找出要使用的语法，因此我无法弄清楚应该使用哪种语法在Google上的正确答案，因为我在列中需要多个变量，而不是合并变量。

此外，我如何才能将在程序中创建的变量（性别和年龄）都保存在同一张纸中，一个又一个地保存，因为上面的代码仅保存最后一个调用的变量，并覆盖前一个变量。 / p>

使用CSV / Excel / SPSS文件使用熊猫创建表/报告

1 个答案:

print（df）