数据治理是什么?到底需要怎么治?一文读懂

什么是数据治理?数据治理不是很多年前就有的概念么?怎么近两年却有越来越多的企业都在提及?数据治理和数据中台之间是什么关系?数据治理当前已发展到了哪个阶段?ETL是什么?不同的企业需要怎样进行数据治理?国内主流的数据治理工具又有哪些?

数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。

数据治理的最终目标是提升数据的价值,是企业实现数字战略的基础,它是一个管理体系,包括组织、制度、流程、工具。

虽然业内无非常明确的定义,但是以大多数人都认可的一种解释来看,数据中台其实是一个概念,是一套可持续的“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。

数据中台和数据治理从落地上来看都包含了数据仓库、数据安全、数据质量、ETL等细分的技术领域,但是却有着较大区别的。

归纳起来看,从价值层面来看,数据中台的价值在于业务数据化、数据资产化、资产服务化和服务业务化。而数据治理则是实现数据资产化的重要步骤。不同于过去的数据平台,数据治理不是数据平台的附件,而是数据中台建设的一个重要组成部分。数据治理,在消除数据孤岛、提高数据质量、保障数据安全等方面,支撑中台数据的可见、可用、可运营。

说到数据中台,不得不提的一家企业就是阿里。从15年阿里提出大中台,小前台战略,去年阿里又倡导中台太厚反而影响到了阿里业务发展和敏捷响应能力,自我否定提出了拆中台,那么是否真正中台战略思想已经过时?答案应该是仁者见仁了。

中台的核心是共性业务能力的抽象下沉,并统一对外提供。很多企业没有大张旗鼓地去规划构建中台,但是经过多年建设形成了自己的服务共享平台和服务资产库,这个服务资产有效的支撑了新的业务应用的开发,那么这个服务共享平台就是对企业有价值的中台。

但是中台的使用范围却是有限的,仅仅限于技术演化相对慢且功能通用性高的场景中。而过往中台的失败案例也往往集中在把中台强推到创新业务中的情况。

较多行业人士认为,中台思想本身没有错,关键点还是在于业务如何变革,业务和IT如何协同去推动中台规划和建设。如果这个没有想清楚,完全没有上中台的必要。

ETL,是用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,是英文Extract-Transform-Load的缩写。常用在数据仓库,但其对象并不限于数据仓库。ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。

简单来说ETL就相当于一个桥梁,把数据从各类不同的数据库,统一化格式转到数据仓库里面。

但是随着目前数字经济的发展,各机构、企业的数据爆炸式增长,ETL的弊端也随之显现,如果采用ETL的模式在传输过程中进行复杂的清洗,会因为数据体量过大和清晰逻辑的复杂性导致数据传输效率降低。

而且,在数据处理过程中,ETL模式在清洗过程中只提取有价值的信息进行存储,而是否有价值却是基于当前对数据的认知进行判断。很多具备潜在价值的数据则会被舍弃,故使用ETL很可能会使得一些有价值的数据被清洗掉无法找回。

当下主流的数据治理工具,以飞算SoData为例,通过该类工具已实现“全量数据接入、实时同步落盘、多任务并行跑批、全程可视化管控”,使得传统的ETL流程得以优化及改善。

飞算SoData可以提供全套通用的数据应用接入和开发标准,让业务用户具备参与数据应用开发的能力和可能,打通数据治理各个环节,为企业数据处理提供高性能、安全可靠、批流一体的数据融合和管理服务的同时,快速满足企业各类不同的数据治理场景。

“飞算科技”是一家自主创新型的科技公司,公司以互联网科技、大数据、人工智能等技术为基础,基于团队在相关领域多年的实践经验,将技术与应用深度融合,推出一系列技术领先且应用层面稳定成熟的产品,致力于为民生产业、中小企业、金融企业等不同类型客户提供科技支持与服务,助力客户实现科技化、数字化、智能化转型升级。返回搜狐,查看更多

数据治理是什么?到底需要怎么治?一文读懂

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

Scroll to top