Thinbug
News
如何将大量的小型非结构化文件传输到HDFS
时间:2018-09-26 14:09:50
标签:
hadoop
flume
flume-ng
我有以下问题:
我需要在一个目录(文件名后附有时间戳)中将较少数量的文件(每3小时近1000000个)传输到HDFS
任何人都可以确定FLUME是这种情况的最佳选择(kafka不是套件,因为我不需要实时)
请提出建议。
0 个答案:
没有答案
相关问题
使用Hadoop处理大量小文件
大数乘以小数
如何加载非结构化数据,如图像和放大器视频进入Hadoop分布式文件系统
在Windows中将大量小文件从一个驱动器传输到另一个驱动器
Hive:消耗大量小型XML文件的最佳方法
将大量大文件传输到s3
HDFS(序列文件)中的单个大文件或多个小文件?
如何将HDFS小文件合并为一个大文件?
如何将大量的小型非结构化文件传输到HDFS
哪种更好的文件格式可以在蜂巢中存储更多的小文件?为什么呢?
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?