我正在尝试从CSV文件中提取一些名称,但是遇到了麻烦。
当我在一小串文本上运行代码时,它会起作用:
z = "This is a bunch of text. I would like to extract A. J. Balfour and maybe some other words or another A. F. Balfour or even G. G. Balfour or maybe even A. G. Balfour"
library(stringr)
str_extract_all(z, regex("[A-Z]. [A-Z]. Balfour", simplify = TRUE))
但是,当我在CSV文件上运行相同的代码时,它将停止返回名称。 z
与我的CSV文件之间的最大区别是CSV文件是一个较大的字符向量。
在全局环境中,R显示z
存储为chr,如果将我从CSV文件中读取的列转换为独立的字符向量,那么我看到R将其读取为hr而不是chr。我不能将此列表强制转换为字符。
任何关于正在发生的事情的想法都会很棒。谢谢!