我正在研究课程数据科学课程并首次涉足python,虽然尊重空白让我疯狂,但这并不算太糟糕。
即使这里没有足够的诊断我的问题也许一个精明的python程序员可以睁开我的眼睛看到gottcha我甚至不知道谷歌。
我一直试图调试我的脚本一段时间无济于事。所有文件等都加载得很好但是当我尝试处理一堆存储的推文并用情感词典对它们进行评分时,我得到的分数是当我使用python解释器但是我的脚本都是零。不同的是,在脚本中我将执行链放在main()中但在CLI中我逐行执行(尽管我确实设置了相关的get_score函数)。
我认为相关的内容是:
import sys
import json
import re
parse_words = re.compile("\W")
data = []
dictionary = {}
...
def get_score(tweet_text):
words = parse_words.split(tweet_text.lower())
word_scores = map(lambda word: dictionary.get(word, 0), words)
score = sum(word_scores)
return score
def main():
"""set up the data files"""
...
for i in range(len(data)):
try: # because not each line contains a tweet
tweet_text = data[i]["text"].encode('utf-8')
except:
tweet_text = ""
print("%6.2f %s" % (get_score(tweet_text), tweet_text))