我有一个包含电子邮件的数据框。有一个名为“ message”的列,如下所示:
> > dataset$message[1]
>[1] Message-ID:...
>
> Date: ...
>
> From: ...
>
> To:...
>
> Subject: ...
>
> Mime-Version: ...
>
> Content-Type:...
>
> Content-Transfer-Encoding: ...
>
> X-From:...
>
> X-To: ...
>
> X-cc:...
>
> X-bcc: ...
>
> X-Folder: ...
>
> X-Origin: ...
>
> X-FileName: ...
>
> > Some message text
换句话说,每个条目包含15行标题,然后是文本。我想要的是从每行中删除这15行,只保留文本,这样
>dataset$message[1]
看起来像这样:
> Some message text
答案 0 :(得分:1)
类似的事情会起作用:
sub("^(?:.*\\n){15}", "", multiline_string_mail, perl = TRUE)
#[1] "Super secret message"
示例数据:(您应始终提供可用的示例数据)
multiline_string_mail =
"hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
hehe
Super secret message"