Apache Atlas的官方介绍页面,主要介绍了Apache Atlas的概述、功能、快速上手、文档等内容。 1. 概述:Apache Atlas是Hadoop的数据治理和元数据框架,具有可扩展的核心治理服务。能帮助企业在Hadoop环境中满足合规要求,还能与企业数据生态系统集成。为组织提供开放的元数据管理和治理能力,可构建数据资产目录,对资产分类治理,并为数据科学家、分析师和数据治理团队提供协作功能。 2. 功能
- **元数据类型与实例**:有针对Hadoop和非Hadoop元数据的预定义类型,也支持自定义类型。类型具备多种属性和继承特性,其实例(实体)用于记录元数据对象详情及关系,还提供REST API便于集成。
- **分类**:可动态创建如PII、EXPIRES_ON等分类,分类可含属性。实体能关联多个分类,方便数据发现和安全管理,且分类可通过数据沿袭自动传播。
- **沿袭**:提供直观UI查看数据处理过程中的沿袭情况,也有REST API用于访问和更新沿袭信息。
- **搜索/发现**:通过直观UI和丰富REST API,支持按多种条件搜索实体,还提供类似SQL的查询语言(DSL)。
- **安全与数据掩码**:对元数据访问进行细粒度控制,与Apache Ranger集成,基于实体分类实现数据访问的授权和掩码处理,例如限制敏感数据访问、对特定数据进行掩码显示。
- 文档资源:包含Apache Atlas 2.4的新特性,还提供构建安装指南、快速入门教程,以及REST API、导出导入REST API、旧版API和开发者设置等相关文档。