数据挖掘?我怎样才能在我的网站上执行它?

时间:2010-07-06 00:03:25

标签: data-mining

我正在准备我的计算机科学毕业项目,我创建了这个网站并且它运行得很好,但我的主管要求我在网站上应用数据挖掘。 但我不明白我该做什么。 该网站是一个社交网络,每个用户都有一个个人资料和博客,并可访问一些要求您注册的电子书,以便您下载。该网站还包含一个音乐服务器,其中包含注册用户可以选择要下载的歌曲或在其个人资料页面中将其添加为收藏的歌曲,该网站包含广告(我使用的是OpenX脚本),因此这是该网站的大部分内容我可以执行数据挖掘的服务,网站是www.sy-stu.com

我需要想法,在面试中提出想法的最佳方式是什么?

3 个答案:

答案 0 :(得分:2)

你可以问你的教授他使用数据挖掘的意图是什么。数据挖掘算法可以执行各种任务,您首先需要定义要完成的任务,然后为此和技术可能性找到一些算法。

我想到了一些关于在项目中使用数据挖掘的想法:

  1. 您可以使用数据挖掘来查找用户根据其他人的收藏歌曲收藏哪些歌曲(电子书等)(找到相似之处,可能关联规则对此很好)。
  2. 您可以使用一些群集算法根据某些参数对用户进行分组,并建议他们可以与同一组中的其他人建立联系(如果您有类似的内容)
  3. 祝你好运!:)

答案 1 :(得分:2)

首先,请求您的主管澄清。不要说'你是什么意思?',而是问'你在期待这样的事吗?'因为它表明你至少已经考虑过了。

如果您无法想到任何事情,或者您的主管含糊不清,请执行一些简单的数据检索和分析,例如

  • 最活跃的会员
  • 最受欢迎的歌曲和书籍。
  • 点击的广告数量等
  • 最受欢迎的网站功能

只需要进行基本分析就足够了 - 你没有做统计学学位。计算出一天或每位用户下载的大多数歌曲,每位用户的平均歌曲数,每天访问的用户数以及注册和永不访问的数量。

目的是说明您的网站正在记录所有活动,以便当您被问到“6月份最活跃的20位用户下载了多少本书”时,您将能够找到答案。

替代方案是一个只运行的网站,您不了解用户的行为方式和他们正在做的事情,这意味着您无法专注于他们认为重要的事情。

答案 2 :(得分:0)

我不确切地知道你想要挖掘什么样的数据,但是你看看谷歌分析?它很容易设置,一旦你注册所有你需要的是包括提供给你的网页的JavaScript。 Google Analytics(分析)会为您提供大量有关访问您的网站信息的统计信息。这就是你需要的吗?所产生的数据也非常容易阅读,并且适合您呈现我认为。