Question

我有这个数据框：

dput（DF）

structure(list(Time = structure(1:4, .Label = c("1/29/2015 2:00", 
"1/29/2015 2:10", "1/29/2015 2:20", "1/29/2015 2:30"), class = "factor"), 
    WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Content.Match = structure(c(1L, 
    1L, 1L, 1L), .Label = "n/a", class = "factor"), WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Status = structure(c(1L, 
    1L, 1L, 1L), .Label = "n/a", class = "factor"), WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Value = c(12L, 
    12L, 12L, 12L), WTAD..SNMP..AppTier.BIGIP.SNMP.Memory.on.Web01.Content.Match = structure(c(1L, 
    1L, 1L, 1L), .Label = "n/a", class = "factor")), .Names = c("Time", 
"WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Content.Match", 
"WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Status", 
"WTAD..SNMP..AppTier.BIGIP.SNMP.CPU.5min.avg.on.Web01.Value", 
"WTAD..SNMP..AppTier.BIGIP.SNMP.Memory.on.Web01.Content.Match"
), class = "data.frame", row.names = c(NA, -4L))

我正在尝试包含此内容的列：CPU.5min.avg.on。*。Value“

library(dplyr)
df<-select(df, Time, contains("CPU.5min.avg.on.*.Value"))

这项工作在Windows R但不是Linux。我有什么想法吗？

Answer 1

Base R解决方案：

df[,c("Time",colnames(df)[sapply(colnames(df), function(u) grepl("CPU.5min.avg.on.*.Value",u))])]

Answer 2

dplyr解决方案：

select(df, Time, matches('CPU.5min.avg.on.*.Value'))

实际上，我很困惑你的解决方案在Windows下工作。 ?select文档说：

contains（x，ignore.case = TRUE）：选择名称的所有变量   包含x

matches（x，ignore.case = TRUE）：选择名称的所有变量   匹配正则表达式x

并且您尝试匹配代码中的正则表达式，因此它不应该在任何操作系统下与contain一起使用。

如何从包含特定文本的数据框列中提取数据

2 个答案: