应用错误收集

我正在使用 Python 处理自然语言处理问题之一。

我的问题：让我们考虑一个字符串

str1 = "United, State is a very nice country"

我们对该字符串进行了预处理，并删除了所有特殊符号，URL，HTML内容等。现在，经过预处理的字符串将变成这样：

preprocessed_str = "United State is a very nice country"

然后，我们将此预处理的字符串传递给我的机器学习模型，该模型返回如下结果：

Country: United State

现在，我要获取原始字符串中“美国”的开始和结束索引。

我们使用 python的str.find（）函数进行了尝试，但返回-1。

我将赞赏我们可以解决此问题的方法和解决方案。在此先感谢：）