递归检索线程注释列表

时间:2015-08-08 21:36:35

标签: python recursion functional-programming reddit praw

我正在尝试编写一个递归函数,可以从Reddit提交中检索嵌套的注释。我正在使用Python + PRAW

def _get_comments(comments, ret = []):
    for comment in comments:
        if len(comment._replies) > 0:
            return _get_comments(tail(comments), ret + [{
                #"body": comment.body,
                "id": comment.id,
                "author": str(comment.author),
                "replies": map(lambda replies: _get_comments(replies, []), [comment._replies])
                }])
        else:
            return ret + [{
                    #"body": comment.body,
                    "id": comment.id,
                    "author": str(comment.author)
                }]
    return ret

def tail(list):
    return list[1:len(list)]

我得到以下输出,这是不完整的并且具有嵌套数组:

pprint(_get_comments(s.comments))
[{'author': 'wheremydirigiblesat',
  'id': u'ctuzo4x',
  'replies': [[{'author': 'rhascal',
                'id': u'ctvd6jw',
                'replies': [[{'author': 'xeltius', 'id': u'ctvx1vq'}]]}]]},
 {'author': 'DemiDualism',
  'id': u'ctv54qs',
  'replies': [[{'author': 'rhascal',
                'id': u'ctv5pm1',
                'replies': [[{'author': 'blakeb43', 'id': u'ctvdb9c'}]]}]]},
 {'author': 'Final7C', 'id': u'ctvao9j'}]

Submission对象具有comments属性,该属性是Comment个对象的列表。每个Comment对象都有一个_replies属性,该属性是Comment个更多的列表。

我错过了什么?我给了我最好的一击 - 递归很难。

1 个答案:

答案 0 :(得分:1)

你几乎正确地得到了它。问题在于,当它很简单时,你会尝试将递归作为复杂的东西。您不需要tail()函数以及map()函数,因为您已经在迭代评论。

我在示例中重命名了您的函数,因为它实际上将注释转换为dicts。

让我们从简单的案例开始,想一想:" okey,我希望有一个功能,它能够将评论列表转换为词典列表"。简单的功能:

def comments_to_dicts(comments):
    results = []  # create list for results
    for comment in comments:  # iterate over comments
        item = {
            "id": comment.id,
            "author": comment.author,
        }  # create dict from comment

        results.append(item)  # add converted item to results 
    return results  # return all converted comments

现在你想要dict还包括转换为dicts的回复列表。你已经有了能够进行这种转换的功能,所以我们只需使用它并将结果放入item['replies']

def comments_to_dicts(comments):
    results = []  # create list for results
    for comment in comments:  # iterate over comments
        item = {
            "id": comment.id,
            "author": comment.author,
        }  # create dict from comment

        if len(comment._replies) > 0:
            item["replies"] = comments_to_dicts(comment._replies)  # convert replies using the same function

        results.append(item)  # add converted item to results 
    return results  # return all converted comments

由于您修改了您调用的相同功能,因此无论它们有多深,它都会转换所有回复。希望它更清楚递归的工作原理。