调查统计图的想法

时间:2011-01-02 15:42:55

标签: javascript statistics diagram survey

我在主题调查和图表中有一些功课。第一项任务是规范调查的输入,因为数据的结构会不时变化。 所以有三种类型的调查:

  • 存储文本的静态字段
  • 动态的,用户可以选择一个选项
  • 和多选字段,用户可以在其中选择多个选项

所以我不是一个真正的统计人员,所以我真的不知道我能用这些数据来做什么。

所以我拥有的数据存储在一个巨大的XML文件中,我可以轻松地了解调查填充的时间,以及字段填充的次数,所以我可以(例如在饼图上显示填充或未填充的关系)。 第二个想法是使用条形图左右显示多选项元素的内容之间的关系。

在多选项元素的情况下,我有想法在一个选项的含义中显示数据。 但问题是,可以展示什么?

另一个问题是静态元素(文本字段等)。可以从单个字段表示哪些数据?

XML字段中的数据是从2001年到2005年收集的。所以也许我可以处理调查的日期,但正如我所说,我真的不知道如何处理数据,尽可能多地收集,创造了大量的图表。

2 个答案:

答案 0 :(得分:0)

规范化数据后(可能比作业的可视化部分更难),您可以执行以下操作:

  • 要显示包含文本的静态字段,您可以将theese文本重新编码为包含较少类别的新变量,这些变量可以适合图形/图表。另一种方法是制作文本的文字云 - 例如wordle.net
  • 每个只包含一个回答的动态字段可能是最容易显示的字段。你可以制作一个饼图来显示属性的百分比,或者更确切地说是一个条形图,它也可以显示百分比/密度或频率(例如,参见R中的ggplot2包)。
  • 要显示多选字段,您应该将日期重新调整为适当的格式(我现在不知道它是什么样子)。这可以通过不同的表来完成,这些表显示所有变量中每个类别的计数(频率)。例如:昨天有187人吃巧克力,160人吃面包,50人吃披萨。然后,您可以轻松地通过条形图显示值。请注意:theese vaules的总和不会等于样本大小,因为任何人都可以选择多个值,因此饼图将是一个非常糟糕的选择。

我希望我能提供帮助。

答案 1 :(得分:0)

我不推荐饼图。请使用条形图或点图。更容易区分不同类别的相似频率。按频率对类别进行排序几乎总是一个好主意。在这里,您可以找到有关Pie Charts Are Bad

原因的简短文章

3D图表可能看起来不错,并且是一种令人印象深刻的人,他们对数据可视化知识很少(可能是您需要的东西;-))。但是大多数专家认为它们是不好的做法,因为使用并非绝对需要的额外维度会使读者分散实际数据。

就我个人而言,我认为crosstables和scatter plots是显示两维数据之间关系的非常自我解释的方式。

报告一些基本统计数据和图表通常是一个好主意,但请确保只在适当的时候执行此操作。如果您想了解哪些单变量统计数据(例如平均值)适合哪些数据,请参阅此Wikipedia article

如果你真的想要了解数据可视化,我强烈推荐关于这个主题的books by Edward Tufte。他们真的很高兴阅读。虽然他们站在坚实的科学基础上,但即使在该领域很少或没有背景的情况下,他们也很容易理解。

祝你好运, 亚历