我想在一个句子中搜索二元组并找到它的索引。例如,请使用以下句子:
在没有功能研究的情况下,目前不可能得出结论 药物是一种与疾病有关的药物。
这里我试图搜索“is a”而不是“is”,因为句子中有“is”和“is a”。
我目前使用ArrayList存储句子并使用“equals”和“contains”进行比较,但结果是我拿起is的索引并返回7而不是索引“is a”。我在代码中使用Java。
答案 0 :(得分:0)
这会让你的指数(charatcers的数量)"是"以一种非常简单的方式
int index= "in the absence of functional studies it is not possible at present to conclude that drug is a disease-related drug.".indexOf("is a");
当你开始按空格分割时,你需要开始关注标点符号...... 自然语言处理要复杂得多,你应该看看http://lucene.apache.org/core/