我想收集openEdX论坛上的所有信息进行定量分析。什么是最常用的专业词使用等。但如何下载/挖掘openEdX论坛?
答案 0 :(得分:1)
我想您可以访问Open edX平台?您需要从所有线程和所有消息中提取文本。用于与论坛互动的库位于lms.lib.comment_client
。例如,要获取特定课程的所有主题,请执行:
lms.lib.comment_client.Thread.search({
'course_id': course_id,
})
对于每个帖子,你必须遍历评论并提取他们的身体,并最终提取他们的头衔。我相信您可以使用thread.to_dict()
方法从线程中获取评论。