我正在处理一个文档,其中每一行都包含对特定事件的描述(发生火灾时,消防员出现并随后写报告)。
事件/报告是由几个不同的人编写的,因此语言变化很大,这使得很难使用一个词为一个特定的上下文编写代码:is.number(search(substring;text))
因为即使单词在文本中,上下文也与我要分析的内容无关。
我希望通过将几个不同的单词/短语“放入”或“存储”到我的“子字符串”中来扩大单词搜索的灵活性,从而能够更接近我希望的特定上下文分析。 这种方式可以涵盖实际上相关的更多数据,但是在单个事件报告中的描述方式却有所不同。
我尝试自己寻找解决方案,但是不确定如何表达此特定查询。
到目前为止,当我尝试梳理2000行时,我只能使用上面的代码段,这有点不足。
我希望有人能够帮助我!
谢谢
示例: 存储以下文字:停火,扑灭大火,扑灭大火到:杀戮火
因此,当我使用杀戮时,以上所有措词都包含在搜索中。