标签: amazon-web-services bigdata text-processing data-processing
这是一个“使用Amazon Web Services的大数据”问题:考虑大量的txt文件(所有文件的内容格式都相同:[title; body; author])。我想将它们存储在AWS中,并能够在整个集合中搜索一个子字符串。这样做的好方法。我还要感谢有关如何存储所有这些数据而不是txt文件的建议(我们正在谈论标题,正文和作者的文章)。
谢谢。