我正在尝试编写一个递归函数,可以从Reddit提交中检索嵌套的注释。我正在使用Python + PRAW
def _get_comments(comments, ret = []):
for comment in comments:
if len(comment._replies) > 0:
return _get_comments(tail(comments), ret + [{
#"body": comment.body,
"id": comment.id,
"author": str(comment.author),
"replies": map(lambda replies: _get_comments(replies, []), [comment._replies])
}])
else:
return ret + [{
#"body": comment.body,
"id": comment.id,
"author": str(comment.author)
}]
return ret
def tail(list):
return list[1:len(list)]
我得到以下输出,这是不完整的并且具有嵌套数组:
pprint(_get_comments(s.comments))
[{'author': 'wheremydirigiblesat',
'id': u'ctuzo4x',
'replies': [[{'author': 'rhascal',
'id': u'ctvd6jw',
'replies': [[{'author': 'xeltius', 'id': u'ctvx1vq'}]]}]]},
{'author': 'DemiDualism',
'id': u'ctv54qs',
'replies': [[{'author': 'rhascal',
'id': u'ctv5pm1',
'replies': [[{'author': 'blakeb43', 'id': u'ctvdb9c'}]]}]]},
{'author': 'Final7C', 'id': u'ctvao9j'}]
Submission
对象具有comments
属性,该属性是Comment
个对象的列表。每个Comment
对象都有一个_replies
属性,该属性是Comment
个更多的列表。
我错过了什么?我给了我最好的一击 - 递归很难。
答案 0 :(得分:1)
你几乎正确地得到了它。问题在于,当它很简单时,你会尝试将递归作为复杂的东西。您不需要tail()
函数以及map()
函数,因为您已经在迭代评论。
我在示例中重命名了您的函数,因为它实际上将注释转换为dicts。
让我们从简单的案例开始,想一想:" okey,我希望有一个功能,它能够将评论列表转换为词典列表"。简单的功能:
def comments_to_dicts(comments):
results = [] # create list for results
for comment in comments: # iterate over comments
item = {
"id": comment.id,
"author": comment.author,
} # create dict from comment
results.append(item) # add converted item to results
return results # return all converted comments
现在你想要dict还包括转换为dicts的回复列表。你已经有了能够进行这种转换的功能,所以我们只需使用它并将结果放入item['replies']
:
def comments_to_dicts(comments):
results = [] # create list for results
for comment in comments: # iterate over comments
item = {
"id": comment.id,
"author": comment.author,
} # create dict from comment
if len(comment._replies) > 0:
item["replies"] = comments_to_dicts(comment._replies) # convert replies using the same function
results.append(item) # add converted item to results
return results # return all converted comments
由于您修改了您调用的相同功能,因此无论它们有多深,它都会转换所有回复。希望它更清楚递归的工作原理。