keen.io中的页面元数据

时间:2014-10-28 13:49:06

标签: analytics keen-io

我对将元数据附加到我们的keen.io网页浏览事件的最佳做法有疑问。在内部,我们使用3种不同的关键字类别来标识一段内容,这些关键字位于每个页面的标签中。一个很好的例子是这样的:

<meta name="namespace:tier1" content="Programming" />
<meta name="namespace:tier2" content="Web Development, Web Operations" />
<meta name="namespace:tier3" content="JavaScript, Analytics, jQuery, HTML, CSS" />

我们希望能够根据这些层对用户进行细分,并执行以下查询:

  • 查看按tier1关键字细分的所有流量
  • 查看属于特定tier1关键字的最热门的tier2关键字
  • ......等等。

以下是我的问题:似乎我们可以将此元数据与网页浏览事件一起发送,但我们最终会有很多可以生活的冗余数据在一个单独的地方。例如,如果我们每天为我们的网页抓取关键字,我们可以按网址对其进行索引,而不是在keen.io中重复所有重复的元数据。

你会怎么做?我是否陷入SQL领域,我是否应该担心重复的数据?

一个相关的问题是我们的关键字基本上是列表,而keen.io文档说我们应该stay away from lists。我需要为每个单词创建一个Metadata事件吗?在每次网页浏览时发送+10请求似乎有点过分。

1 个答案:

答案 0 :(得分:1)

简短回答 - 不要担心重复。说到事件数据,非规范化就是你的朋友。当每个事件包含许多属性时,Keen的查询界面被设计为最强大的 - 有效的是当时的世界状态。

米歇尔写了thinking about event data的指南,将其与关系数据进行了对比。我们中的许多人(包括我)之前一直被困在SQL领域,并且发现本指南很有用:)

就列表而言 - 它主要是您想要避免的对象列表。在这种情况下,您的列表是字符串之一,因此您仍然可以对该属性进行大量查询。

有关Keen&amp; amp ;;的更多信息对象列表检查此SO问题:Nested JSON Objects In Keen IO