我正在从事语言学项目,我需要在其中搜索文本中的模式。我需要搜索以下模式:„ blah blah blah **target word** blah blah"
。换句话说,(德语)引号中包含的特定单词的实例,引号之间可以有任意数量的其他单词。
我使用的软件说它是用Ruby编写的,它使用正则表达式进行匹配。我需要知道它们是否适合这项工作。这是Ruby正则表达式可以捕获的那种模式吗?
答案 0 :(得分:1)
简单。假设您在target_word
中有一个字符串,则会执行以下操作。
/\„.*?#{target_word}.*?\"/m
您可能需要特别考虑德国报价。
答案 1 :(得分:0)
听起来你确实需要正则表达式或tokenization
如果您没有编程经验,我会选择后者,正则表达式很难掌握。