我想帮助我的朋友分析社交网络上的帖子(Facebook,Twitter,Linkdin等)以及几个博客和网站。
当谈到存储数据时,我没有大量数据的经验。哪一个最适合每天发送一万条帖子,推文和文章:数据库,XML文件,纯文本?如果数据库,哪一个?
P.S。 我将要开始编程的语言是Python。
答案 0 :(得分:2)
这取决于您想要使用数据的方式。如果您有结构化数据,并希望在不同程序之间进行交换,则xml可能是一个不错的选择。如果您进行批量处理,纯文本可能是一个不错的选择。如果要过滤数据,数据库可能是一个不错的选择。