数据标准|什么是数据标准?

数据标准(什么是数据标准?)
随着大数据行业的兴起 , 数据的重要性不言而喻 , 对数据进行应用的工具层出不穷 , 带来了巨大的经济效益 。可很快就发现了诸多数据问题 , 制约了数据应用的持续发展 。但企业处理数据问题总是摆脱不了“头痛治头 , 脚痛治脚”的弊端 , 往往会导致数据问题总是会重复出现 。而要从根本上解决这些数据问题 , 那就必须从数据标准管理出发 , 对数据全生命周期进行规范化管理 , 从而从根本上解决这些数据问题 。
数据标准的定义数据标准是进行数据标准化的主要依据 , 构建一套完整的数据标准体系是开展数据标准管理工作的良好基础 , 有利于打通数据底层的互通性 , 提升数据的可用性 。简述之 , 即数据标准(Data Standards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束 。
用通俗一点的话来讲 , 我们需要在组织内定义一套关于数据的规范 , 好让我们都能理解这些数据的含义 。比如在银行业 , 对于“客户”这个字段 , 往往不同部门的理解都会出现偏差 , 可能客户部就认为“客户”就是办了他们银行的卡的人 , 而网银部认为是在他们的银行网站注册过、或者通过这个银行转账的人都属于客户 。就这样没有统一标准的话 , 不仅增加沟通成本 , 而且项目实施、交付、信息共享、数据集成、协同工作往往会出现各种问题 , 这些花了大代价的数据就体现不出应有的价值 。
而数据标准管理就是将这一套数据标准 , 通过各种管理活动 , 推动数据进行标准化的一个过程 , 是数据标准落地必不可少的过程 。
数据标准的分类数据标准是进行数据标准化、消除数据业务歧义的主要参考依据 。数据标准的分类是百思特网从更有利于数据标准的编制、查询、落地和维护的角度进行考虑的 。
数据标准有多种分类 , 对于不同的分类方式 , 均可采用以元数据为数据标准制定的基本单元构建数据标准体系 。
数据可以分为基础类数据和指标类数据 。基础类数据指业务流程中直接产生的 , 未经过加工和处理的基础业务信息 。指标类数据是指具备统计意义的基础类数据 , 通常由一个或以上的基础数据根据一定的统计规则计算而得到 。相应地 , 数据标准也可以分为基础类数据标准或指标类数据标准 。
基础类数据标准是为了统一企业所有业务活动相关数据的一致性和准确性 , 解决业务间数据一致性和数据整合 , 按照数据标准管理过程制定的数据标准 。指标类数据标准一般分为基础指标标准和计算指标(又称组合指标)标准 。基础指标具有特定业务和经济含义 , 且仅能通过基础类数据加工获得 , 计算指标通常由两个以上基础指标计算得出 。并非所有基础类数据和指标类数据都应纳入数据标准的管辖范围 。数据标准管辖的数据 , 通常只是需要在各业务条线、各信息系统之间实现共享和交换的数据 , 以及为满足监控机构、上级主管部门、各级政府部门的数据报送要求而需要的数据 。
在基础类数据标准和指标类数据标准这个框架下 , 可以根据各自的业务主题进行细分 。细分时应尽可能做到涵盖企业的主要业务活动 , 且涵盖企业生产系统中产生的所有业务数据 。以银行业的基础类数据标准和指标类数据标准分类为例 , 基础类数据标准分为客户数据标准、产品数据标准、协议数据标准、渠道数据标准、交易数据标准、财务数据标产数据标准、公共代码数据标准、机构和员工数据标准、地域和位置数据标准等 。指标类数据标准包括监管合规指标、客户管理指标、风险管理资产负债指标、营销管理指标、综合经营指标等 。如图:
数据标准|什么是数据标准?



数据标准的制定过程数据标准作为全组织级的规范 , 会全面考虑企业的业务系统现状、业务情况、未来发展、人员结构等多方面因素 , 制定过程也是相当严格的 。制定过程如下图:
1、收集国标、行标、现有标准
收集该行业国家标准、行业标准 , 收集途径是标准委员会官网、行业协会网站
梳理组织现有标准 , 通过《数据标准调研表》收集信息 , 形成组织现有标准文档