所以我有一个数据框,它由我从.csv导入的数千条记录组成。数据框中的一个变量是源自词典的自由文本字段。数据行采用以下格式。
请注意,以下不是向量,而是变量'date'中的char数据行(它们恰好看起来像是向量):
c("9th november 2018", "27th october 2018"),
c("three months", "6 months"),
c("24th december ", "2th january 2019", "25th january 2019")
基本上,我要做的只是从第一组引号中删除字符串,然后删除其余的,所以:
c("9th november 2018", "27th october 2018")
9th november 2018
我正在使用以下代码,但是它从最后一组引号中提取了字符串:
LexiDate3$finaldat3 <- sub('.*,"*(.*?) *" *', '\\1', LexiDate3$Date_new)
返回:
27th october 2018")
这并不理想,对于我的一生,我无法弄清楚这一点。任何帮助将不胜感激的家伙。
谢谢。
答案 0 :(得分:0)
这看起来如何?请注意,输出周围的引号通过print方法放置在此处,而不嵌入字符串中。
indent_align_string