使用大型数据集操作研究问题的最佳编程语言是什么?

时间:2010-11-24 22:06:23

标签: java sql vba

我已经完成了我的毕业生公共政策计划,但它并不是所有技术专业 - 一些经济学和计量经济学,但不需要任何CS知识。 DC中很大一部分研究工作需要基本的编程知识水平。大多数情况下,他们希望能够使用大型数据集执行高级搜索和检索功能的人员,并在他们的服务器中保存不同格式的内容。并且,他们想要STATA / stats知识,我有一些。

我的问题是:开始学习某些编程以达到这个级别的最佳位置在哪里?例如,Java,SQL,VBA或其他最好的东西,对于这些目的最有用吗?而且,我需要多少数学来编写和运行简单的请求?

由于

8 个答案:

答案 0 :(得分:3)

我叫阿尔瓦罗。我曾在大型基因数据库担任高级生物信息学家。在哈佛大学学习生物信息学。

您需要的脚本语言是Perl。

然后你需要完全理解SQL。所有这一切都可以在网上找到。

如果你是高级的,你也可以使用R编程语言进行统计。检查有关R项目的网页。还有MathLab。

但不是一次全部!

为此目的忘记Java或VBA。

祝你好运

答案 1 :(得分:1)

对于统计和数据库查询/操作,我将从SQL开始。

答案 2 :(得分:1)

请记住,我不了解这个领域,因为我是一名Web开发人员,但我认为像Haskell,F#,R或Python这样的东西是你最好的选择。

是的,SQL。我会学习SQL92进出,然后在你得到最低标准后继续学习MS SQL的扩展(我假设为GOVT工作你将主要在windows环境中)。

答案 3 :(得分:1)

也许您应该扩展您的STATA知识并尝试通过SQL / ODBC接口访问STATA中的大数据。

VBA不再积极开发,绝对不是一个好选择。

答案 4 :(得分:0)

好吧,如果你将使用数据库,你几乎肯定需要知道一些SQL。但SQL本身只是一种与数据库通信的方式 - 它不是一种实际的编程语言。 SQL经常与编程语言(如Java或PHP)配对。就个人而言,我不是Java的粉丝,但它在大学中被广泛使用和教授,所以它可能是一个不错的选择。

答案 5 :(得分:0)

我是一名创建了大量报告的Java程序员。我建议同时使用编程语言(当然我会推荐Java)和SQL,因为创建独立于任何实际用途的表并不是很有趣。

我主要使用DB2,但是为了开始我会推荐一个免费的数据库,比如MySQL。安装完成后,您可以设置表格,了解参照完整性,简单查询,连接以及各种好东西。

然后,您可以创建一些简单的程序来显示数据并向DB读取数据。 Java中有许多简单的例子,如果您了解数据库的基础知识,这将很容易理解。应用程序的需求将促使您创建更复杂的数据库设计。

在此之后,Java中的当前方向正在转向称为ORM(对象关系映射)的东西,听起来很吓人......但它不是,它的作用是什么...更多......你能忘记吗?关于SQL,所有表都自动转换为Objects。在Java中工作时,对象是基本构建块。简而言之,您可以使用仅知道数据库理论和Java语言的数据库,而无需具备SQL的特定知识(这在不同的数据库之间是令人烦恼的不同)。尽管如此,如果您了解SQL,它仍然更容易学习。

使用Perl等脚本语言的建议也很好。如果你对为网络制作程序有点兴趣,那么PHP也是一个不错的选择。

您可能想要获得某种认证。所有主要数据库和许多语言都有很多。这些科目很大,即使您只考虑认证要求,您也可以获得有关学习内容的指导。

对于大多数应用程序,我认为你不需要太多数学。我只使用average()和一些数学作为日期...我的一个激情是图形编程所以我当然不介意数学只是大多数数据库都充满了商业数据所以我不会太担心。

答案 6 :(得分:0)

你有多少时间?

据我所知,我的第一个(也是唯一的)建议就是把你认识的最近的程序员带到最近的酒吧,以获得有关编程和数据库的基本知识:-) 然后返回stackoverflow.com

这就是我在1997年所做的,在几乎相同的情况下,成为前五大的财务顾问。

答案 7 :(得分:0)

我会避免使用任何标准编程语言,而是前往统计分析平台。我不是专家,但我想起了S-Plus,SPSS也是如此。您可能需要单击下面的“数学”链接,因为程序员将指导您使用编程语言。不确定人们做什么统计,但我怀疑他们都知道SQL和Perl,例如。