标签: unix hdfs
我创建了一个电子表格,其中包含hadoop目录中的所有目录名称和时间戳。我手动将每天的条目复制到电子表格中。现在,管理层希望我根据这些数据创建报告并使其自动更新。
我的最初方法是编写一个脚本,该脚本将文件系统读取到文本文件中,在该文本文件上创建Hive表,然后将表内容读取到Tableau中。我知道Tableau可以获取文本文件,但据我所知仅在笔记本电脑本地。
这种方法有意义吗?我是否使这个复杂化了? 谁能提供更简化的解决方案? 谢谢!