删除R中重复字符之前的所有内容

时间:2019-01-31 16:12:44

标签: r dataframe path

我在每一行都有列,指出了文件的路径:

\u0027

我想删除/fire/A/ega/vol1/XDFG00001004213/exomes100/filename /fire/A/ega/vol1/XDFG00001004213/exomes100/filename /fire/A/ega/vol1/XDFG00001006815/exomes100/filename /fire/A/ega/vol1/XDFG00001006816/exomes100/filename /fire/A/ega/vol1/XDFG00001006817/exomes100/filename /fire/A/ega/vol1/XDFG00001006818/exomes100/filename XDFG00001004043/exomes100/filename XDFG00001004043/exomes100/filename 之前的所有内容,因此看起来像这样:

/exomes100/*

我尝试使用/exomes100/filename /exomes100/filename /exomes100/filename /exomes100/filename /exomes100/filename /exomes100/filename /exomes100/filename /exomes100/filename ,但是由于每行的数字都变化,我找不到sub的正确字符组合。

您知道是否还有其他功能或正确的字符组合以删除路径的那一部分?

非常感谢!

1 个答案:

答案 0 :(得分:1)

我们可以使用subexomes捕获字符,然后在替换中使用捕获组的后向引用(\\1

sub(".*\\/(exomes.*)$", "\\1", str1)