正则表达式,R中的多行提取

时间:2015-05-09 19:48:07

标签: regex r multiline

我在R中第一次出现模式后删除所有内容时出现问题。我已使用paste(readLines(url), collapse="\n")导入数据。

例如,我的字符串为\"id=\"fruit_info\">\n<tr class='thead'>\n<th colspan=2>Strawberries</th></table>\n</tr>\n</table>\n<tr class

我想在第一次出现</table>后删除所有内容。我想看到的是;

\"id=\"fruit_info\">\n<tr class='thead'>\n<th colspan=2>Strawberries</th>

我正在尝试的方法似乎没有注册第一个</table>出现而没有提供预期的结果。

谢谢!

1 个答案:

答案 0 :(得分:6)

尝试使用内联(?s)修饰符,该修饰符会强制点.跨越换行符序列。

sub('(?s)</table>.*', '', x, perl = TRUE)