使用大型XML文件进行数据挖掘

时间:2018-01-29 21:11:20

标签: xml nlp

Haven没有使用过很多.xml文件,所以在确定如何开始时寻找一些专家帮助。

尝试从位于here

的xml文件中挖掘Stackexchange数据

有单独的文件,如帖子,用户,徽章,PostHistory等,最终需要加入"为了得出任何见解。此外,还需要将NLP(自然语言处理技术)应用于评论,帖子等。

我可以选择(a)存储和(b)处理数据?我知道R,C和SQL /数据库。

提前致谢!

0 个答案:

没有答案