配对两个字符串[words]

时间:2018-11-25 13:49:22

标签: python string

我正在尝试建立统计模型。在这两种情况之间,我陷入了以下困境:

for pos_token in tokens:
    for pos_feature_word in pos_features:

此处,令牌是传入句子的令牌, pos_features 是一个.txt文件。

这里 pos_token pos_feature_word 是单词(字符串)。我该如何搭配?

赞:我的目标是得到这样的东西:

if pos_token == pos_feature_word

信息:我正在尝试匹配完整的字符串(单词)而不是字符串中的字符。因此,字符顺序很重要。我正在做的是(现在),如果我创建的pos_features列表中存在pos_token,则创建它们。

3 个答案:

答案 0 :(得分:0)

对于做统计模型的人来说,您很难解释自己的问题。

根据我的理解,您想检查两个字符串是否具有相同的字符,而不是相等。如果是这样,请首先检查两个字符串的长度,如果它们将具有相同的字符,它们必须相等,然后循环遍历一个字符串中的字符,然后检查另一个字符串中是否存在。

tr <- read.tree(text = "(((L2,L3),L4),L1);") 

答案 1 :(得分:0)

您的问题还不够清楚,无法找到您的问题,但也许您在读取文件时遇到了问题。我创建了一个类似的脚本,该脚本很好用,请尝试一下,然后找出对您不利的脚本。

#!/usr/bin/python3

tokens = ["cat", "dog", "fish"]
filename = "pos_features.txt"

with open(filename, "r") as pos_features:
    for pos_feature_word in pos_features.readlines():
        for pos_token in tokens:
            if pos_token == pos_feature_word.strip():
                print ("equal at", pos_token)

pos_features.txt 的内容:

cat
bird
turtle
dog

输出将是:

equal at cat
equal at dog

答案 2 :(得分:-1)

我认为         for pos_word in tokens: if pos_word in pos_features: 会