如何跟踪HDFS上发生的变化。 我想知道在特定时间范围内(例如上午8:00到9:00)HDFS发生的变化。我们需要跟踪文件的更改而不是文件内容。
有人可以帮我这个吗?
答案 0 :(得分:0)
尝试使用通知API。见:
stream = this.dfs.getInotifyEventStream();
Event raw_event = null;
while ((raw_event = this.stream.poll()) != null) {
logEventFromHadoop(raw_event);
}