中培伟业IT资讯频道
您现在的位置:首页 > IT资讯 > 精选文章 > 中培专家论-企业如何利用元数据管理数据资产

中培专家论-企业如何利用元数据管理数据资产

2018-06-22 14:58:23 | 来源:中培企业IT培训网

▌企业数据资产管理

企业数据分布在各个系统,数据分布散、体量大,如何识别企业数据资产类别,划分数据资产的区域和层次,这是我们要关心的问题。

数据资产的梳理需要兼顾业务视角和技术视角,从业务视角看,分为数据域、数据主题和数据实体。数据域指由数据主题根据其业务耦合程度聚合而成的高阶数据主题群,一般与业务域有着紧密的对应关系。比如金融里的业务域分为投资业务域、保险业务域、贷款业务域等。数据主题是由业务信息按照业务耦合程度所聚合而成。比如客户主题、产品主题、财务主题、人力资源主题等。数据实体指适合信息系统处理的结构化的信息,是业务信息的抽象和规范化的逻辑描述。比如与投资业务流程相关联的投资业务信息,与保险流程相关联的投保业务信息等。

从技术实现角度看,包括包括逻辑实体和物理实体。逻辑实体是数据实体的逻辑定义,描述实体之间的继承和关联关系,明确实体的属性构成。比如财务报表中的所有者权益变动表,它由上年年末余额、本年年初余额、本年增减变动金额、本年年末余额等四大部分共同构成,单独一项或部分数据对于所有者权益变动来说,没有意义。

这些相关的元组的集合形成所有者权益变动的最小集合,称为一个“逻辑实体”。物理实体数据实体的物理实现定义,即数据库中存储的具体数据实体表,包括DB数据资产、接口数据资产、报表数据资产、数据标准资产和企业数据模型等。

盘点数据资产,需要以元数据为基础,从业务到技术,再从技术到业务反复迭代,形成企业数据资产管理的全貌。

正因为元数据定义了各层次数据对象的属性,所以可以根据元数据识别对象的含义、关联关系、管理信息。比如某企业的数据资产管理层次为区、主题域、系统、表、字段,每个层次对象都由元数据定义具体特征,以系统元数据为例,包括系统名称、英文名称、系统适用范围、系统主要功能、系统关联信息、业务主管单位、技术主管单位等信息。以字段元数据为例,包括信息项名称、业务含义、业务规则、数据管理机构、数据类型、数据长度等信息。

建立统一的元数据管理有助于企业发挥元数据管理的作用。整合并集中存储各系统的元数据信息,形成元数据库集市,近年来已经成为企业数据治理的重要措施。一方面,通过元数据管理了解企业数据资产和数据分布情况,另一方面,通过元数据集中管理推广元数据应用。在此基础上,编制元数据地图将所有系统关联起来,并通过ETL(数据抽取、转换、加载)任务和数据表之间的关系实现数据影响分析以及元数据的查询和统计功能。

元数据热度分析是元数据使用情况统计的一个具体应用,元数据被访问的次数,被访问次数越多,热度就越高。元数据热度分析可以帮助用户分析元数据的使用需求和数据价值。

为了实现企业数据资产的有效管理,通过元数据的自动采集,建设数据资产的统一视图,实现数据资产的盘点、展示。元数据全景视图可以结合地图的设计理念,进行图层的划分,每个图层展示不同颗粒度信息,每层图层下钻上钻平滑衔接。元数据全景视图纵向层次在域、系统、表、字段,可以随鼠标滚轮的滚动方向做无级伸缩,各层次平滑衔接,展现丰富的数据资产信息,包括以下方面:

数据主题级别、系统级别、表级别、数据节点的全景视图;

查看、分析系统的元数据资产情况;

查看元数据访问热度情况,可以从元数据类型、访问用户等维度对元数据热度

信息进行分析;

查看元数据的版本情况,通过时间周期查看元数据的版本变化情况统计分析。

以上信息均可以通过数据图标形式展现。

▌利用元数据进行数据关联分析

以往业务人员在进行变更时时,需要技术人员配合,进行大量的变更影响分析,这种分析耗时耗力,而且也容易遗漏。通过元数据的分析,可以方便地定位某系统数据变化的影响。元数据分析管理可实现血缘分析、影响分析、全链分析和特定元数据分析等四大功能。

1 ▏血缘分析

元数据血缘分析的主要使用对象为业务人员。业务人员可以通过血缘分析快速查找和获取到数据的来源,定位问题出现的环节。血缘分析的对象可以是区域、系统、表(报表)、字段(指标)等,通过逐级追溯数据的来源,获取数据的源头。

2 ▏影响分析

元数据地图应用影响分析的主要使用对象为业务人员和数据管理人员。可以通过影响分析快速查找和获取到数据可能影响的范围,定位数据变更可能涉及的环节。逐级推导数据的影响,获取数据的影响范围,查询范围为全企业系统。这样可以获得区域变化的影响、系统变化的影响、报表变化的影响和单一字段(指标)的影响。

3 ▏全链分析

全链分析的主要使用对象为数据管理人员。数据管理人员可以通过全链分析快速查找和获取到数据所涉及的所有环节,了解数据加工整个过程的全部情况,了解数据的来源,清楚数据的影响。通过逐级追溯数据的来源,获取数据的源头,并从数据源头逐级推导数据的影响。影响分析的对象可以是区域、系统、表和字段等。

4 ▏特定元数据分析

系统元数据分析主要是满足业务人员和数据管理人员,对特定关心的系统、表、字段的选定的对象,进行之间的血缘影响分析,帮助使用者掌握所关心系统、表、字段之间影响的情况。

▌结束语

元数据管理提供了有效的分析和管理能力,帮助业务人员清楚的了解企业的数据信息,包括数据资产的分布情况、各系统数据流向、业务指标和业务报表来源和影响、数据的业务含义和规则等。帮助技术人员了解各系统内物理表的关联关系、影响及生成逻辑,查询系统、物理表的更新、备份、ETL(数据抽取、转换、加载)执行等信息,为企业提供更好的数据服务。


相关阅读