保持字数

时间:2017-03-24 02:07:33

标签: python-3.x

我正在编写一个程序来统计“好”的数据。并且'坏'话。该程序使用两个文本文件,一个有好词,一个有坏词,用于检测分数。我目前有以下内容:

...

程序在Python中执行,但我无法通过它来计算得分。我不确定是什么错误。

1 个答案:

答案 0 :(得分:0)

代码中没有明显的错误。以下是一些需要检查的事项:

1)pos / neg文件中的行只有一个单词吗?如果没有,则需要拆分。

2)情况是否相同?如果没有,请务必对目标词和输入文本进行包装。

3)使用 str.split()通常不是拆分可能包含标点符号的自然文本的最佳方法。考虑类似re.findall(r"[A-Za-z\'\-]+", text)

的内容

4)你会更好的查找性能是pos / neg字存储在集合而不是列表中。