我的代码有问题。它不会从文件中读取某些文本。
我的文本文件与此相似。
A.1 Blah blah
Blah blah blah. Other random sentence.
A.2 Blah
Blah blah blah blah. Other random sentences.
A.3 Blah blah blah
Blah blah blah blah blah. Another random sentence.
1.1.1
我提取了以下部分:
A.1
A.2
A.3
我试图获取包含这些部分的行, 所以:
A.1 Blah blah
A.2 Blah
A.3 Blah blah blah
我通过以下方式做到这一点
kwic( original,phrase(sections), window =20, valuetype="fixed",
case_insensitive = TRUE)
原始表示原始文本,而sections是提取的部分。我将Quanteda软件包用于kwic。
但是,我的原始文件中未检测到这些部分。即使我硬编码
这些中,未检测到这些部分。我由
read_file("...txt")
并通过eval(readLines("...txt"))
获取部分。
即使我对原始文件使用eval(readLines("...txt")
,也不会检测到这些部分。
但是,如果我完全改变了这些部分,而只是将它们替换为 原始文件:
Blah
1.1.1
blah blah
检测到内容,并产生所需的输出。我不知道为什么会这样。