我需要为CSV或Excel或SPSSfile创建表或数据列表,该表具有100个被调查者,其中数据文件中有56个变量,仅使用pandas或任何其他使用Python的库,在尝试此方法时,请您帮帮我吧,无法创建包含两个以上变量的表。
我使用pandas库来尝试上述要求。
我需要创建一个Excel文件,该文件在行Gender
/ Age
下具有单独的表,在列中具有其他问题。
Column1 Column2 Column3 Column4 Column5 Column6 Column7 Column8 Column9 Column10 Column11 Column12
Question No. Code Total RQ2
Total Male Female 18-24 25-30 31-35 Yes No
Gender Base
1 Male
2 Female
Age Base
1 18 or below
2 18-24 yrs
3 25-30 yrs
4 31-35 yrs
5 36-40 yrs
6 41 or above
99 Refuse to answer
Mean
答案 0 :(得分:0)
我已经为上述请求尝试了以下代码。
将熊猫作为pd df = pd.read_excel(“ Data.xlsx”)
print(df)
Gender = pd.crosstab(df.Gender,[df.Gender,df.AgeDummy,df.RQ2])
Age = pd.crosstab(df.AgeDummy,[df.Gender,df.AgeDummy,df.RQ2])
打印(性别)打印(年龄)
Gender.to_excel(“ DataTabulation.xlsx”,sheet_name =“ Sheet1”) Age.to_excel(“ DataTabulation.xlsx”,sheet_name =“ Sheet1”)
下面是我得到的结果。
性别1 2 AgeDummy 3 4 5 6 7 8 3 4 5 6 RQ2 2 2 2 2 2 2 2 2 2 2 AgeDummy 3 18 0 0 0 0 0 1 0 0 0 4 0 31 0 0 0 0 0 3 0 0 5 0 0 15 0 0 0 0 0 3 0 6 0 0 0 12 0 0 0 0 0 2 7 0 0 0 0 8 0 0 0 0 0 8 0 0 0 0 0 7 0 0 0 0
这是不正确的,我知道“ pd.crosstab”不是我可以使用的正确语法,但是由于无法找出要使用的语法,因此我无法弄清楚应该使用哪种语法在Google上的正确答案,因为我在列中需要多个变量,而不是合并变量。
此外,我如何才能将在程序中创建的变量(性别和年龄)都保存在同一张纸中,一个又一个地保存,因为上面的代码仅保存最后一个调用的变量,并覆盖前一个变量。 / p>