对于非结构化数据,HDFS的访问控制有多精细?

时间:2016-06-20 11:51:19

标签: hadoop permissions hdfs acl bigdata

我正在寻找任何技术论文,解释如何对 HDFS摄取的非结构化数据进行访问控制

  1. 粒度级别是否可以小于 POSIX-ish 文件权限?

  2. 同样, RecordService (来自 Cloudera )等产品如何为存储组件的安全性提供抽象层,处理非结构化数据?

  3. 例如,如果我有一个非常大的电子邮件存档文件(超过1TB),我是否能够指定比整个文件本身更精细的ACL?我正在考虑电子邮件标题等。

1 个答案:

答案 0 :(得分:0)

  1. 支持的粒度是行级和列级。 See details
  2. 目前,要使RecordService正常工作,您的数据必须组织为Hive Metastore表。将来,RecordService可能会从文件本身推断出结构/架构(但不是今天的情况)。