如何开始使用大数据和Web分析

时间:2016-04-01 04:01:39

标签: google-analytics statistics analytics web-analytics bigdata

我目前对研究大数据分析和网络分析感兴趣,但我不知道如何以及从何处入手。我试着在互联网上寻找,但有些东西对我来说很先进。在走这条路之前,我是否需要先掌握统计和数学方面的技能,知识?

我目前的计划是每个周末参加在线课程,因为我目前在平日担任副软件工程师,并且练习像R这样的大数据所需的编程语言。我已经拥有计算机科学学位所以熟悉用一些统计和数学方法不是问题。任何建议和意见都非常感谢!

对于那些已经有经验的人,您的经验如何?您最常与哪些人一起工作?

1 个答案:

答案 0 :(得分:2)

我和你一样在同一条船上。我作为业务分析师在Web开发部门工作。我做了一些软件开发,数据挖掘和数据可视化,但我不断提高自己的技能,因为这对我来说非常有趣,它让我成为一名多才多艺的员工。

网站分析/大数据
如果您有自己的网站,请查看您是否可以访问公司的Google Analytics帐户。 API非常好,R中的预构建软件包可以很容易地获取大量数据。如果他们的网站足够大,您可以轻松创建自己的真实数据集。虽然这些可能不像“大数据”那样“大”,但它们对于实践数据可视化来说绝对是非常棒的。我建议学习Shiny和R Markdown。您可以轻松创建可与公司共享的Web统计数据可视化。如果你最终遇到了你正在尝试处理的数据量的问题(即:如果他们有大量的网络存在),那么你可能会考虑使用Spark来处理大数据。 Coursera专注于大数据 - https://www.coursera.org/specializations/big-data。如果您只是“审核”它们,您可以免费参加所有课程。您不会获得证书或任何东西,但您可以访问所有课程资料。他们显然通过Spark,Hadoop,Pig和Hive。我没有参加,但我参加的UCSD Coursera课程非常好。

Coursera显然不是最终的全部......还可以查看edx.org,Pluralsight,Udemy等...您可以获得一年免费的Pluralsight会员资格 - 只需谷歌即可。我的某种方式通过微软。 Pluralsight最喜欢的课程(与数据/分析无关)Ethical Hacking。 Udemy经常在HUGE课程上做出惊人的交易 - 比如21小时关于Python的数据分析讲座等等。只需注册该服务,您就可以在一两周内获得“特别优惠”。他们通常是10-20美元。 https://www.brighttalk.com/也是与数据科学/分析相关的网络研讨会和讲座的好地方。

<强>数据库
我的公司使用SQL Server(Microsoft),因此我还在MVA(Microsoft Virtual Academy)上学习了一些数据库类。他们有很多课程,从完整的菜鸟到刷新技能:MVA Database Stuff

数据集
如果您发现自己需要大数据集,请加入Kaggle。它们通常具有用于机器学习的优秀数据集,但您可以自己使用它们来挖掘和进行可视化。我会特别寻找带标签的数据集。许多较大的套装都是完全匿名的 - 没有标签,也没有任何缺点。但是,如果你只是四处寻找,这不是很有趣。此外,有人在此编译了大量公共数据源:https://github.com/caesar0301/awesome-public-datasets。最后,NYC Open Data是我最喜欢的网络数据集之一。有些是超级无聊,但有一些很酷的分析done on parking tickets和类似。

更多...
如果您只是想要阅读更多课程或阅读书籍,请查看https://www.metacademy.org/。他们有一些建议的途径来学习深度学习,机器学习,贝叶斯统计和其他类似的东西。我认为机器学习是一个很好的下一步 - 一旦你精通软件开发,数据库管理/创建/查询和可视化。

更多......
只是让自己沉浸其中。有大量的数据博客,播客,聚会小组,会议和新闻。尽你所能进入那里并弄清楚发生了什么以及谁在做什么。无论如何,它非常有趣。我最喜欢的两件事:datatau(数据科学的黑客新闻)和我的NY NY(上面链接,停车票)。