我有流动的文字字符串:
string <- "['CBOE SHORT-TERM VIX FUTURE DEC 2016', 81.64],\n\n ['CBOE SHORT-TERM VIX FUTURE JAN 2017', 18.36]"
有一种从文本中提取数字元素的简单方法,而不必使用:
string_table <- strsplit(string, " ")
然后选择第n个元素并继续strsplit
直到我拥有我需要的东西。
结果应该是:
result <- c(2016, 81, 64, 2017, 18, 36)
谢谢你。
答案 0 :(得分:5)
我们可以通过将模式指定为一个或多个数字(str_extract_all
)来使用[0-9]+
。输出为长度为1的list
,使用[[
提取向量并转换为numeric
。
library(stringr)
as.numeric(str_extract_all(string, "[0-9]+")[[1]])
#[1] 2016 81 64 2017 18 36
如果我们使用的是strsplit
,请使用非数字字符
as.numeric(strsplit(string, "\\D+")[[1]][-1])
#[1] 2016 81 64 2017 18 36