如何删除r中的电子邮件正文

时间:2017-07-05 10:57:27

标签: r regex email extract gsub

我正在尝试从Outlook中的单个文件夹中提取电子邮件中的特定数据。

我目前通过“.csv”文件读取数据(如果有更好的选项,请告知)并能够以“DT”形式获取所有信息。主题有 Thisispresent: FGD1-GRT1-1670946819-1069287620 ineverymail successfully

我想从主题行和正文“GRT1CFV1x1143468254x199”中提取动态的“FGD1-GRT1-1670946819-1069287620”。主题中的问题有一个共同的因素,它从主题中的第二部分开始(GRT1)。

我尝试使用提取主题 str_extract(mail$Subject,"[:alnum:]+[:digit:]+[:digit:]") 它给出了[1] NA "1670946819"

我想要的输出应该在一列中有主题(FGD1-GRT1-1670946819-1069287620),在第二列中有主体(GRT1CFV1x1143468254x199)。

在搜索时我遇到了R中的“edeR”包,我尝试使用它,它给了我一些错误 Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : Traceback (most recent call last): File "<string>", line 1, in <module> File "C:\Users\kishore\Documents\R\win-library\3.3\rJython\jython.jar\Lib\imaplib.py", line 501, in login imaplib.error: [AUTHENTICATIONFAILED] Invalid credentials (Failure)

我使用`extractBetween(username =“username”,password =“password”,folder =“folder new”,startDate =“06-June-2017”,endDate =“06-July-2017”,nmail = 100 )

凭据是正确的,应该有其他我不知道的东西。任何事情都会有所帮助。

0 个答案:

没有答案