统计数据收集:从网络到数据库

时间:2010-10-02 15:24:24

标签: database r webforms statistics

我是一名贸易统计员,我想了解如何建立一个可以将数据收集到数据库中的网站。对于个人用途,我使用Google表单来收集数据,并将所有内容填充到电子表格中。但是,这可能不适合更专业的环境,特别是当我们有多个页面/表格时。我想象两个用途:

  1. 一个网站,我可以将链接发送给其他人,以便他们填写,类似于Google表单。
  2. 只有授权用户才能登录才能填写数据的网站。想一想在研究中定期跟踪患者的环境。让临床医生将数据直接输入数据库是很酷的,因为他/她填写表格而不是让另一位数据分析师将他的书面表格转录到数据库中。
  3. 显而易见的解决方案是聘请网络开发人员。但是,我喜欢在可管理的情况下自己做事。我想一个Web开发人员必须知道html,php和数据库知识(例如,MySQL或PostgreSQL)。我在这些方面的经验仅限于在我的linux服务器上设置wordpress博客。我使用html的经验也很有限,因为我使用emacs org-mode从纯文本生成它们。我希望能够以最小的学习曲线听到解决方案。我的偏好当然是免费的开源软件和基于Linux的,但我想听听所有可用的解决方案(我们的数据管理员是Windows用户)。

    我最近在Linux Journal上阅读post提及REDCap,但似乎您必须获得机构的许可才能使用。

    我还在这篇文章上标记了“R”,因为我想听听R用户在数据收集方面做了些什么。我最终将用R分析数据,但所有数据分析都从科学问题和数据收集开始。

    谢谢!

    更新2010年10月4日:感谢大家到目前为止的回复。看来,到目前为止提出的大多数第三方解决方案都将数据存放在供应商托管的数据库中。我想在SQL Server中存放所有数据。也就是说,来自Web的数据输入实时进入数据库,准备进行数据分析。

4 个答案:

答案 0 :(得分:7)

也许limesurvey.org项目很有意思......

答案 1 :(得分:4)

听起来像你有自己的医学研究。从您所描述的想要做的事情中可以想到许多令人担忧的问题。隐私至少是其中之一。它将在哪里举办?您是否已获得患者的同意以电子方式收集和传输他们的信息?您存储的数据(如果有)可以组合以显示其身份。

就个人而言,我避开DIY在线数据收集工具。我向Ipsos,Research Now / E-Rewards等公司支付费用,使用我设计的调查问卷对数据收集进行编程和管理。原因是,了解如何设计研究和分析数据是一回事。但如果你接受过统计学方面的培训 - 我可以安全地争辩说你“不知道”关于数据收集的问题。当然你可能知道一堆关于抽样理论,但是当涉及到获取数据时 - 最好把它留给专业人士。

有许多“工业品质”在线数据收集工具。

  • 确认(几乎是在线数据收集的黄金标准)
  • DASH(较小的追随者,但非常灵活)

还有纯粹基于网络的解决方案,其中一些是免费的(不是我建议使用它们)

  • QuestionPro
  • SurveyMonkey
  • Zoomerang公司

虽然,除非您正在对超过50名患者进行研究,否则我建议让医生或其助手填写Excel表格并将其发送给您的公司。

此外,您不太可能需要设置用户名/密码系统。你想要什么被称为“开放链接”。如果受访者单击链接并输入信息,则响应者可以添加标识符信息。您不需要密码,因为人们只能输入信息而不能读取信息。

我上面提到的大多数系统都是通过电子邮件向受访者(临床医生)发送基于网络的调查链接的想法。这可以很容易地适应您的特定需求,并提醒临床医生填写表格。

如果您的问题类型很简单。我相信你可以聘请程序员来组建一个网站,其中包含您在授权前端背后所需的表格。 PHP / MySQL可能会成功。但是,在进行医学研究之前,我会仔细检查您所在司法辖区的隐私法。

答案 2 :(得分:4)

我使用在线表格(实际上是其中两个)进行了内侧研究。我的问题非常离散,特别是我正在研究的疾病。

之前在一个相关项目中,我创建了两到三页的问卷,然后主题和外科医生填写表格,我们的研究协调员将其输入我们的数据库。这是很多工作,有很多错误的余地。我不喜欢它。在线表格要好得多。

我使用了SurveyGizmo并对此感到满意。两年前我看了很多选项。 Google Forms当时不存在。我选择SurveryGizmo主要是因为他们有一个声明(证明)他们符合HIPAA。我无法确保安全性,例如与其他网站的ssl连接。然而,为了使自己进入该功能(https连接),我必须购买企业级别的事件,尽管我可以使用免费服务的其他所有功能。 SurveyGizmo还为我们的研究机构认可的非营利组织减少了50%。

SurveryGizmo易于设计和投入生产,无需自己编程。很容易以csv格式下载数据并直接读入R.虽然我有一些奇怪的问题,我需要帮助。我不得不使用“旧”格式进行导出,以便它成为一个直接的csv。此外,csv文件具有前两行的标题行的奇怪特征。但是我solved that problem with the help of stackoverflow

SurveryGizmo具有出色的逻辑和管道,使我只能提出相关问题,从而不会浪费我的受访者的时间,更重要的是,没有无关紧要的问题可以让受访者感到困惑。

最后,我能够以这样的方式使用SurveyGizmo,以便跟踪我们(研究人员)的履行和后勤。例如,当有新的潜在科目有兴趣参与时,我们会收到通知。我们能够记录联邦快递跟踪号码以及相应主题的记录。

基本上它运作良好。

答案 3 :(得分:0)

最安全的收集机密调查数据的平台是Confirmit。这里涉及一个学习曲线 - 您将在VisualSQL中编码,它仅在Confirmit中使用。调查回复将导出到csv文件,您可以在其中分析R中的结果。

如果您正在收集任何机密数据或受访者需要唯一访问链接的数据,以便他们只能看到自己的调查版本,您将需要使用Confirmit。数据存储在Confirmit的数据中心,但是他们的数据比其他供应商更安全(即,第三方无法入侵您的调查并查看个人的回复,或拦截从您的数据发送的数据确认答辩人。)