随着互联网的普及和信息技术的发展,数据开始成为各行各业发展的重要资产。如何对大量的数据进行有效的处理分析成了必须面对的问题,“数据治理”的概念应运而生。本文,成都星云联动主要从数据治理的概念和数据治理包括的内容两个方面对数据治理进行介绍。

(图片来源于网络,侵删!)

什么是数据治理?

数据治理并不是一个全新的概念,只是大数据时代,数据量和复杂度有了很大的变化,对数据质量的需求也被提到了一个全新的高度。业界对数据治理也没有一个唯一的定义。

数据治理(DataGovernance),百度百科对其的解释是:数据治理是是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。美国全球数据管理协会认为:数据治理是对数据资产管理行使权利和控制的活动的集合。桑尼尔·索雷斯提出:数据治理是广义信息治理计划的一部分,即制定与大数据有关的数据优化、隐私保护与数据变现的政策。

(图片来源于网络,侵删!)

数据治理包括哪几个方面?

数据治理是一套持续改善管理机制,通常包括了数据架构组织、数据模型、政策及体系制定、技术工具、数据标准、数据质量、影响度分析、作业流程、监督及考核等内容。从技术角度来看,数据治理涉及的IT技术主题包括元数据、数据标准、数据质量、数据集成、主数据、数据资产、数据交换、生命周期、数据安全多产品组成的一整套解决方案。

元数据:采集汇总企业系统数据属性的信息,帮助各行各业用户获得更好的数据洞察力,通过元数据之间的关系和影响挖掘隐藏在资源中的价值。

数据标准:对分散在各系统中的数据提供一套统一的数据命名、数据定义、数据类型、赋值规则等的定义基准,并通过标准评估确保数据在复杂数据环境中维持企业数据模型的一致性、规范性,从源头确保数据的正确性及质量,并可以提升开发和数据管理的一贯性和效率性。

数据质量:有效识别各类数据质量问题,建立数据监管,形成数据质量管理体系,监控并揭示数据质量问题,提供问题明细查询和质量改进建议,全面提升数据的完整性、准确性、及时性,一致性以及合法性,降低数据管理成本,减少因数据不可靠导致的决策偏差和损失。

数据集成:可对数据进行清洗、转换、整合、模型管理等处理工作。既可以用于问题数据的修正,也可以用于为数据应用提供可靠的数据模型。

(图片来源于网络,侵删!)

主数据:帮助企业创建并维护内部共享数据的单一视图,从而提高数据质量,统一商业实体定义,简化改进商业流程并提高业务的响应速度。

数据资产:汇集企业所有能够产生价值的数据资源,为用户提供资产视图,快速了解企业资产,发现不良资产,为管理员提供决策依据,提升数据资产的价值。

数据交换:用于实现不同机构不同系统之间进行数据或者文件的传输和共享,提高信息资源的利用率,保证了分布在异构系统之间的信息的互联互通,完成数据的收集、集中、处理、分发、加载、传输,构造统一的数据及文件的传输交换。

生命周期:管理数据生老病死,建立数据自动归档和销毁,全面监控展现数据的生命过程。

数据安全:提供数据加密、脱敏、模糊化处理、账号监控等各种数据安全策略,确保数据在使用过程中有恰当的认证、授权、访问和审计等措施。

星云联动之前的文章有对主数据、元数据、数据质量等的详细介绍,如果感兴趣可以关注官网之前的文章。成都星云联动专注于工业物联网,目前有设备运维和智慧能源管理平台,如果您有相关需求,可以点击右侧咨询按钮发起对话获取相关系统功能和案例噢!