我正在尝试建立统计模型。在这两种情况之间,我陷入了以下困境:
for pos_token in tokens:
for pos_feature_word in pos_features:
此处,令牌是传入句子的令牌, pos_features 是一个.txt文件。
这里 pos_token 和 pos_feature_word 是单词(字符串)。我该如何搭配?
赞:我的目标是得到这样的东西:
if pos_token == pos_feature_word
信息:我正在尝试匹配完整的字符串(单词)而不是字符串中的字符。因此,字符顺序很重要。我正在做的是(现在),如果我创建的pos_features列表中存在pos_token,则创建它们。
答案 0 :(得分:0)
对于做统计模型的人来说,您很难解释自己的问题。
根据我的理解,您想检查两个字符串是否具有相同的字符,而不是相等。如果是这样,请首先检查两个字符串的长度,如果它们将具有相同的字符,它们必须相等,然后循环遍历一个字符串中的字符,然后检查另一个字符串中是否存在。
tr <- read.tree(text = "(((L2,L3),L4),L1);")
答案 1 :(得分:0)
您的问题还不够清楚,无法找到您的问题,但也许您在读取文件时遇到了问题。我创建了一个类似的脚本,该脚本很好用,请尝试一下,然后找出对您不利的脚本。
#!/usr/bin/python3
tokens = ["cat", "dog", "fish"]
filename = "pos_features.txt"
with open(filename, "r") as pos_features:
for pos_feature_word in pos_features.readlines():
for pos_token in tokens:
if pos_token == pos_feature_word.strip():
print ("equal at", pos_token)
pos_features.txt 的内容:
cat
bird
turtle
dog
输出将是:
equal at cat
equal at dog
答案 2 :(得分:-1)
我认为
for pos_word in tokens:
if pos_word in pos_features
:
会