在R中选择data.table键

时间:2011-05-01 00:58:44

标签: r indexing key data.table

如何为data.table个对象选择正确的键?

考虑因素与RDBMS类似吗?我的第一个猜测是查看有关RDBMS的索引和键的一些文档。 Google提出了与Oracle相关的有用的stackoverflow question

该答案的注意事项是否适用于data.tables?也许除了与UPDATE,INSERT或DELETE类型语句有关的那些之外?我猜测我们的data.tables对象不会真正以这种方式使用。

我试图通过使用文档和示例来了解这些内容,但我还没有看到任何关于键选择的讨论。

PS:首先感谢@crayola pointing我对data.table套餐的支持!

1 个答案:

答案 0 :(得分:1)

我不确定这是一个非常有用的答案,但既然你在问题中提到我,我会说出我的想法。但请记住,我自己是一个data.table新手。

我个人只在有明显好处时使用密钥,例如合并数据表,或者看起来很明显这样做会加快速度(例如重复对变量进行子集化)。 但据我所知,有时根本没有必要定义密钥;该软件包已经快于没有密钥的data.frame