从pdfs中提取数据时如何使用ifelse函数

时间:2018-01-21 02:24:10

标签: r regex string text stringr

我在提取工作中遇到的部分pdf文档时遇到了困难。有不同的车型有定价,当文件使用小写而不是大写字母时,我不知道如何提取美元金额。我认为ifelse声明可以正常工作但我写它有困难。下面是一个数据示例:

$1500 Chevy
$2800 Ford
$1200 Subaru

我的代码目前看起来像这样:

Model <- as.numeric(str_match(f[1], "\\$(\\d+)\\s\\Ford|ford"))[[2]])

1 个答案:

答案 0 :(得分:1)

我们可以使用(?i)

使其不区分大小写
as.numeric(str_match(v1, "\\$(\\d+)\\s(?i)ford")[,2])
#[1]   NA 2800 1200

如果我们需要'福特'或'雪佛兰'

as.numeric(str_match(v1, "\\$(\\d+)\\s(?i)(ford|chevy)")[,2])
#[1] 1500 2800 1200

数据

v1 <- c("$1500 Chevy", "$2800 Ford", "$1200 ford")