如何更改大数据集中的列而不进行替换

时间:2017-03-14 23:02:59

标签: r dataframe

我有一个大型数据集,部分如下所示:

m1    m2  m3   m4
jp-1  1    2   3
jp-2  2    9   8
jp-4  2    4   4
jp-8  3    2   1
jp-7  1    4   4
jp-9  2    4   0
jp-3  2    4   4
jp-6  3    1   5
  ...
  ...
  ...

每列约有100000行,我想从列"jp-"中删除m1。我在网上查看了这个问题,但许多解决方案是用新值替换列,这不是我想要的。我想要的是以下内容,只是从"jp-"删除m1

m1   m2  m3   m4
1    1    2   3
2    2    9   8
4    2    4   4
8    3    2   1
7    1    4   4
9    2    4   0
3    2    4   4
6    3    1   5
  ...
  ...
  ...

1 个答案:

答案 0 :(得分:3)

您可以使用sub功能删除前缀jp-并覆盖列的内容。如果d是您的数据:

d$m1 <- sub("jp-", "", d$m1)

修改

如果您想创建课程numeric的列,可以添加as.numeric

d$m1 <- as.numeric(sub("jp-", "", d$m1))