如何从openEdX论坛中挖掘文本?

时间:2017-07-05 07:55:33

标签: openedx

我想收集openEdX论坛上的所有信息进行定量分析。什么是最常用的专业词使用等。但如何下载/挖掘openEdX论坛?

1 个答案:

答案 0 :(得分:1)

我想您可以访问Open edX平台?您需要从所有线程和所有消息中提取文本。用于与论坛互动的库位于lms.lib.comment_client。例如,要获取特定课程的所有主题,请执行:

lms.lib.comment_client.Thread.search({
    'course_id': course_id,
})

对于每个帖子,你必须遍历评论并提取他们的身体,并最终提取他们的头衔。我相信您可以使用thread.to_dict()方法从线程中获取评论。