数据治理主要是企业内部部署的解决方案, 该领域的大多数领导者都是一些传统的软件公司, 其中大部分的企业已经在某种程度上向云端过渡. 而 Gartner 公司认为, 未来几年, 数据治理也将转向云计算.
如今, 数据已成为企业的货币, 但管理数据不当可能会很快失去控制. 麻省理工学院最近的一项研究发现, 对于一些企业来说, 大数据正在变成糟糕的数据, 并可能导致企业损失高达 25% 的收入, 因为这些企业不得不修复不良数据, 消耗了运营费用.
处理大量混乱的数据对于企业来说可能是一个挑战, 而且随着更多数据的创建和收集, 这将变得越来越困难. 这就是数据管理或数据治理非常重要的原因.
调研机构 Gartner 公司将主数据管理定义为 "数据治理", 这是 "一种技术支持的学科, 其中业务和 IT 协同工作, 以确保企业共享的主数据资产的一致性, 准确性, 管理性, 语义一致性和问责制."
主数据是描述企业核心实体 (包括客户, 潜在客户, 公民, 供应商, 站点, 层次结构和账户科目表) 的一致和统一的标识符和扩展属性.
数据治理主要是企业内部部署的解决方案, 该领域的大多数领导者都是一些传统的软件公司, 其中大部分的企业已经在某种程度上向云端过渡. 而 Gartner 公司认为, 未来几年, 数据治理也将转向云计算.
在这个领域中, 很多企业都在激烈竞争, 因此在此这个领域缩小一下范围, 列举了全球 10 个主要的市场参与者. 如上所述, 大部分公司都是传统厂商, 而其他是市场的新成员.
全球十大数据治理解决方案服务商
(1)亚马逊网络服务公司(AWS)
AWS 公司从其简单存储服务 (S3) 开始构建数据治理解决方案, 其中包括 Elastic MapReduce Athena, 这是一种用于存储在 S3 中的数据的计量查询引擎. 为了配置企业的云环境, AWS CloudFormation 允许企业使用简单的文本文件为其应用程序建模和配置所需的全部资源. Amazon CloudWatch 监控并收集所有资源的指标. AWS Systems Manager 允许企业监控所有资源, 并自动执行常见操作任务. 此外, 还有用于配置管理的 AWS OpsWorks, 特别是如果企业使用 Chef 或 Puppet 的话.
(2)IBM 公司
由于是生产大型机的传统厂商, IBM 公司在数据治理方面经验丰富. 它提供独立 DBMS, 包括各种版本的 DB2,IBM PureData System for Analytics,DB2 Analytics Accelerator,Hadoop, 以及 IBM BigInsights,DataFirst Method 和 IBM Watson Data Platform. 其主要数据治理系统是 IBM Information Server, 它提供了对数据的统一管理. 它可以帮助用户查找和搜索资产, 探索资产之间的关系, 搜索非结构化数据源以及结构化数据库, 并允许自动发现新数据.
(3)微软公司
微软公司的数据管理始于其旗舰产品套件 Office 365, 它允许客户管理整个内容生命周期, 从创建或导入数据到存储数据, 并创建策略以保留和永久删除内容. 它运行在一系列用于云计算的微软产品之上, 无论是内部部署还是微软 Azure. 它提供了一个称为 Azure SQL 数据仓库的数据仓库设备, 一个基于 Hortonworks 的 Hadoop 发行版(称为 Azure HDInsight), 一个 Azure Data Lake 数据收集器. Azure SQL 数据仓库也是对云计算数据存储的兴趣日益增长.
(4)Oracle 公司
Oracle 公司从旗舰产品 Oracle Database 12c,Oracle 大数据管理系统, Oracle 大数据 SQL 和大数据连接器开始入手. 对于特定的数据管理, 它具有 Oracle 企业元数据管理器 (OEMM) 和 Oracle 企业数据质量(EDQ). 它还通过 Oracle 数据库云服务器和 Oracle 大数据设备为其软件堆栈提供了整套硬件系统, 并且具有 Oracle 数据库即服务, Exadata 云服务和大数据云服务等云服务.
(5)SAP 公司
SAP 公司是 Oracle 公司的竞争对手, SAP 公司提供了 IQ DBMS 和 Hana, 用于内存数据库管理系统和分析. Hana 已更新为包含备份, 灾难恢复, 分析, 与 Apache Spark 和多租户集成等功能. SAP Hana 是 SAP 平台的一个组件. 然后是 SAP 主数据治理, 它整合和管理来自一个地点的数据, 以确保数据质量和一致性.
(6)Teradata 公司
Teradata 公司以其分析平台而闻名, 包括 DBMS, 数据仓库设备, 云计算数据仓库. 它通过 Hadoop Aster Analytics 进行连接, 并通过 Teradata Listener 流式传输数据, 所有这些功能都旨在通过统一的界面呈现信息. 其主数据管理是一个完整的数据治理生命周期框架.
(7)Cloudera 公司
Cloudera 公司是三大 Hadoop 发行公司之一, 在这方面非常成功. 它提供了 Cloudera Enterprise, 这是一款 Hadoop 发行版, 其中包含用于批量分析的 Hadoop 和用于实时分析的 Spark, 以及用于治理的 Cloudera Navigator, 用于内部部署和云中的集群管理的 Cloudera Manager 和 Cloudera Director, 并支持 AWS, 微软 Azure 和谷歌云等云平台.
(8)Dell Boomi 公司
Boomi 是 Dell 公司于 2010 年收购的一家业务部门, 专门从事内部部署和云端的主数据管理. Boomi 公司通过其 Boomi 过程库提供很少甚至没有编码开发, 该库提供了构建治理应用程序的示例. 它还支持微软 Azure,AWS 和谷歌的 PaaS 供应商和连接器, 提供用于与合作伙伴连接的 EDI 连接器, 并支持用于 DevOps 开发方法的 Docker 容器.
(9)SAS 公司
SAS 公司的整个业务都基于分析. 它提供了称为 SAS Data Governance 的主数据管理解决方案, 可帮助企业准备和管理传统数据源和大数据源. 它允许企业通过通用数据模型维护和管理数据属性, 标记元数据中的更改, 创建快照, 存储和管理列表和层次结构, 并创建关于数据运行状况和所需补救的报告.
(10)TIBCO 软件公司
TIBCO MDM 专门提供存储在不同孤岛中的企业数据的统一视图, 使企业能够清楚地查看其业务数据并快速采取行动. TIBCO MDM 可在企业内提供数据工作流的可视化, 使企业可以根据需要观察流程并进行改进. 它可以通过 TIBCO Clarity Cloud Edition 在内部部署和云中使用.
来源: http://bigdata.51cto.com/art/201806/575545.htm