我正在尝试使用nltk解析一些数据和格式,但我似乎无法通过函数迭代为多个变量分配多个返回(请参阅下面的def预处理函数。)我尝试重写我的代码,这通常会导致一个很大的调试,但似乎我正在打击一个故意在那里的Python墙。
def get_7text():
with open('parsed_text/Larrys Pizza & Sports Parlor_text.csv','r') as file:
reader = csv.reader(file)
dict = [row for row in reader]
file.close()
my_dict = [l[0] for l in dict]
text= my_dict[0]
new_dict=ast.literal_eval(text)
for k,v in new_dict.items():
exec(k + '=v')
return Monday,Tuesday,Wednesday,Thursday,Friday,Saturday,Sunday
def preprocess():
for day in Days:
day = str(day)
day = sent_tokenize(day)
day = [word_tokenize(s.lower()) for s in day]
day = [pos_tag(s) for s in day]
return day
#code here
Monday,Tuesday,Wednesday,Thursday,Friday,Saturday,Sunday = get_7text()
Days=[Monday,Tuesday,Wednesday,Thursday,Friday,Saturday,Sunday]
Days=preprocess()
Get7text()返回7个我可以成功分配的字符串。我曾经首先让它返回一个7键的字典,但格式化对于NLTK的POS标记等很烦人。
问题是这个。每当我运行预处理时,程序只保留列表中的第1项并忘记其他6.我试图强制该函数将每个返回的输出分配给名为Days的变量列表,但无济于事。我还注意到AFTER Days = preprocess(),Days丢失了除第一个元素之外的所有元素(星期二到星期日是1个字符串的空列表)。但是,Days [3]或Days [5]会正确打印预期数据。
我期待那里有更好的代表方法。网上没有帖子提到它,无论如何这似乎是一个粗略的事情。
答案 0 :(得分:1)
每当python看到'return'时,它会说:“哦,回来,你必须完成你的代码。我现在就停止这个功能。”因此,它在第一次迭代后停止。相反,你应该做的是:
def preprocess():
retList = []
for day in Days:
day = str(day)
day = sent_tokenize(day)
day = [word_tokenize(s.lower()) for s in day]
day = [pos_tag(s) for s in day]
retList.append(day)
return (retList)
当然,如果这不起作用,那么我就错过了一些东西,我们都不知所措。