R语言 - 提取两个分隔符之间的字符串

时间:2016-12-09 18:08:17

标签: r

我想在"部分描述:"之间提取文字。和" - 安装"用R;同样,需要提取其他文本 - 因为文本是连续无法提取的。

示例文字:

  

支持队列:WW_SC GD OB V5; V5业务:;本地   周末:真的;当地假日:假; ***注意:这是一个   PARTNER设备。请遵循特殊合作伙伴流程而不是   标准支持链。支持ID:469   ********************************* **活动及活动附件** ********* ************************事件编号:34c-48a6操作系统版本:Windows Server,   2003活动时间:2015-07-10T00:29.7110Z零件号:   xxxxxx-001,部分描述:1000瓦交流热插拔电源 -   作为主电源或冗余电源安装在计算机机箱中(800   瓦特在100VAC至1000瓦特,200VAC最大功率) - 需要   100 / 240VAC,50 / 60Hz,RoHS是,CSR A错误类型:HW无附件。   推荐的操作:Bay 2中的电源出现故障,应该是   替换为备件号xxxxxx-001。

1 个答案:

答案 0 :(得分:4)

您可以执行以下操作:

sub(".*Part Description:(.*)Installs.*", "\\1", txt)

这会将整个字符串替换为Part Description:Installs之间的部分。这导致:" 1000 watt AC hot-plug power supply - "

或者使用stringr即可:

require(stringr)
str_sub(str_extract(txt, "Part Description:.*Installs"), 18, -9)

这会给你相同的结果。