我有来自大量传感器(> 500)的数据流,我需要在我的HDFS上写入这些数据。传感器几乎每1秒发送一次数据,每个推送数据的大小约为300B。问题是我已经经历过,每当我开始使用追加模式推动HDFS上的大量内容时,它就会开始引发许多异常并被卡住。我需要找到一种方法来处理每秒大量的文字,比如采用存储数据的中间层,然后慢慢将它们推入HDFS。我不知道是否有任何DB可以为此工作,如果是,哪个是最好的?
更新:我环顾四周,很难理解不同解决方案的极限和潜力。
现在,我的问题是,是否有人必须处理类似的问题,这对我的案件来说可能是一个很好的解决方案。