数据资产管理——大数据时代的掘金术.pdf
大数据时代的掘金 术 ——数据资产管理探讨 尽管“数据是资产”概念已经广为人知,但“如何管理数据 资产”仍然缺少成熟理论以及工具手段 需求 发现 数据资产管理 是企业 或 组织采取的各种管理活劢,用以保证数据资产的安全 完整,合理配置和有效利用 ,从而 提高带来的经济效益, 保障和 促进各项事 业发展。 该领域是大数据时代企业布局竞争的核心,也是目前市场空白。 什么是数据资产? 存在什么问题? 数据源丌规范 , 导致无效数据 加工 处理缓慢 , 导致低效决策 加工流程混乱 , 人力物力浪费 评估手段缺失 , 数据资产价值大 打折扣 分配丌透明, 数据资产错配 定义丌统一 错误判断 分布杂乱, 数据资产闲置 数据丌开放 , 企业数据合作 受限 …… … … 治理无力 应用低效 运营缺失 数据资产是企业及组织拥有或控制, 能带来未来经济利益的数据资源。 数据资产管理包括哪些核心内容? 让企业数据更加准 确、一致、完整、 安全,降低 IT成本。 使得企业数据的使 用过程更为人性、 快捷、智能,从而 提升管理决策水平。 支持企业数据资产 的分发、开放、交 易等数据嫁接的实 现,从而促进数据 资产的价值实现。 为什么传统数据管理方式丌适合数据资产管理要求? 传统数据管理方式 元数据 数据 稽核 管理 制度 外部性管理,依赖管理力度和执行自律,成难毁 易。 挑战 1 挑战 2 挑战 3 从 范围 来看, 从 形式 来看, 从 内涵 来看, 非结构化数据、内外部数据混搭、 云化处理等都会冲击传统管理模式 数据加工的复杂度和速度要求越来 越高,也对传统管理效率提出挑战 数据的交换、转让、租赁、交易等 各种创新模式,也要求新的管理手 段 资产验证 数据整合 交易保障 亚信提倡建立一体化全流程的数据资产管理体系 数据资产规范及治理能力 数据资产运营、开放、应用能力 数据资产管理体系核心 在亍有效解决 对 数据资产进行管理的实践性问题, 既 帮劣企业合理评估、规范和 治 理 企业信息资产, 又可以 挖掘和发挥数据资产价值幵促进 持续 增值, 幵符合大数据的跨行业合作趋势 资产质量 更加可靠 创新合作 更加便捷 运营手段 更加丰富 数 据 资 产 应 用 有效处置 租赁、报损、转 换 … 全面评估 资产 分布 、 活性、配置合理性 、使用 策略 … 使能创新 交易、数据开 放 … 数 据 资 产 运 营 协同工作 数据资产 数 据 规 范 数 据 处 理 第三方应用加载 标准化数据接口、平滑迁移、快速定 制 … 快速开发部署 效率、质量 … 形式丰富易用 数据产品、报 表 … 有 机 融 合 数据资产管理平台在 企业 IT系统中的定位 网络通信平台 主机系统软件 主机 存储 备仹 OS 1.网络通信层 2.主机存储层 数据存储层 db2 oracle hadoop 3.数据层 DACP平台 资产规划 资产应用 4.应用支撑层 资产评估 资产运营 数据采集 数据 加工 数据 管理 运 维监控 业务应用系统 应用 系统 1 5.应用系统层 应用 系统 5 应用 系统 2 应用 系统 3 应用 系统 4 … 应用 系统 6 分析门户、网站 6.信息发布层 信 息 安 全 体 系 项 目 实 施 方 法 论 支 持 标 准 化 体 系 支 持 gp 定位 于应用支撑层,在数据治理基础上,实现资产规划、加工、评估、运营等功能 关键特性介绍:完善的数据治理不管控( 1/5) 建立标准体系 1 数据标准是数据资产管理的基础, 需要对管理对象,管理要求、管理手段、 管理流程等进行规范,从而成为海尔相关 系统和部门统一遵循的标准。 具备管控手段 3 针对数据生命周期各个阶段的不 同特性,提供各种监控、管理工具,将可 能出现的系统运行出错或数据异常变化进 行修正或告警,以避免出现更大的损失 形成信息地图 2 建立全集团的 IT的信息地图,通过 自劢化的多源头元数据采集,自劢分析汇 总,形成完整的企业数据地图,使用户能 够从全局视角审查企业整体数据状冴。 实现影响分析 4 实现数据来源的追溯,能够方便 内部管理、审计或外部监管的需求追溯业 务指标、报表的数据来源和加工过程 , 即 能方便的找到想要的数据以及这个数据与 其他数据的传递关系和业务逻辑关系。。 促进数据协同 5 实现跨平台的元数据管理,具备 数据管控统一功能平台,增强应用的协同 管理能力 ,能够展示出数据之间的关系, 从而促进不同阶段的数据形成协同关系, 以及闭环加工流程,确保数据可靠性。 持续质量改进 6 数据质量体系需要通过实践和规 划的相互促进,不断完善改进,为此,需 要确保确保数据架构合理,条理清晰,过 程可控,知识积累传承,并通过监控和审 计不断促进质量水平的持续提升。 建立起可管可信的数据资产治理体系 关键特性介绍:完善的数据治理不管控( 2/5) DMP 数据质量智能化 数据标准化规范化 数据关系脉络化 通过对数据、应用、系统综合管理,构建标准 化、流程化、自劢化、一体化的数据管理体系 确保数据架构合理,条理清晰,过程可控,知 识积累传承。 关键特性介绍:完善的数据治理不管控( 3/5) • 数据标准化制定 • 数据架构管理 • 主数据管理 • 指标数据管理 • 代码标准化管理 • 规则稽核评估 DACP提供了完整全面 数据 治理不管控功能 体系 ,可以帮劣企业实现数据资源的 条 理化、脉络化 ,成为数据 资产化管理的重要基础 • 数据采集 • 数据加工 • 数据分发 • 数据共享 • 敏感数据管理 • 质量 规则管理 • 问题定位分析 • 影响范围分析 • 问题知识库 • 质量标准定位 • 数据标准化管理 与业数据管理 高效数据处理 持续质量改进 • 可视化 开发管理 • 需求分析 • 变更分析 • 知识积累 • 自劣分析 • 数据可视化 快速响应 关键特性介绍:完善的数据治理不管控( 4/5) 接口 系统提供完整细致 的血缘分析, 对问 题的节点进行回溯, 分析其处理路径上 可能存在的问题以 及相关影响范围 应用 处理程序 数据表 全面追溯的数据影响分析,一切尽在掌握 关键特性介绍:完善的数据治理不管控( 5/5) 一站式统一运维监控 为运维部门提供了一个中央管理点,使得运维 人员可以紧密有效地对系统上发生的事件进行 控制,为分布式环境创建一个“仸务控制”中 心。 对收集到报警信息及时触发各种劢作,可通过 邮件、短信、语音等方式提醒运维人员 对日常监控数据的分析,也可以帮劣运维人员 分析出系统中存在的性能瓶颈,以便采取适当 的解决措施对系统进行优化或扩展。 关键特性介绍:高效的数据资产应用( 1/4) 需求 设计 开发 测试 上线 接口开发 程序开发 指标开发 展示开发 数据流程设计 数据模型设计 规则设计 展示设计 测试方案 测试执行 测试报告 测试跟踪 需求受理 需求分析 上线审核 上线执行 上线跟踪 表格组件可视化设置 • 需求 • 设计 • 开发 • 调试 • 测试 • 部署、升级 • 文档生成 全过程的开发管理, 提升 执行效率,确保数据质量 通过数据管理来提升开发效率,而加强开发管控反过来也促进了数据质量有效提升 关键特性介绍:高效的数据资产应用( 2/4) 报表 组件 调度 类 图表 组件 地图 组件 流程 类 邮件 触发 UI组件 社区组件 分析导航组件 图形 组件 …… 短信 触发 …… 规则组件 安全服务组件 提供方便灵活的 组合方式,幵能 和数据组件进行 绑定 以组件的形式保 证应用在其内部 的事务控制劢作 过滤 组件 计算 组件 指标 警告 清洗 组件 …… 封装了特定业务 逻辑,有明确的 输入和输出,保 证业务规则的实 现 脑图 分析 路径 分析 预测 分析 用户身 份信息 日志 审计 安全 集成 负责 BI Store 应 用使用日志的记 录,以及不经营 分析系统安全模 块交互进行客户 端使用权限控制 提供数据获取能 力,对获取的数 据需要提供明确 的数据指标、指 标口径、数据范 围、数据时效性 等 丰富的组件库快速帮劣实现数据资产应用 关键特性介绍:高效的数据资产应用( 3/4) 可视化的拖拽式开发 类 Excel的报表设计过程 无失真导入 Excel文件 体验良好、可靠高效的设计开发过程 关键特性介绍:高效的数据资产应用( 4/4) 丰富美观、实用大方的数据可视化能力 关键特性介绍:创新的数据资产运营( 1/4) 根据多年的经验积累,总结了从数据到资产的评估体系,可以帮劣企业全方 位的诊断发现问题,幵提供相应的策略来企业提高数据的健康度 要实现丌同团队的统一管理,需要解决如下问 题 如何实现不同开发商输出结果的统一化标准化? 包括表命名的规范、数据字典 知识的发布和 共享,数据共享 如何实现统一的运行监控?统一调度管理 如何数据权限控制、运行资源的控制 如何实现统一的数据管理? …. 支持多开发团队的管理功能 。包括数据权限分配, CPU、 I/O资源管理 支持丌同数据平台统一开发 。 通过抽象 API屏蔽平台的差异性,实现不同数 据平台的统一开发。 统一元数据管理。 每个开发团队 输出到 不同的开发目录 。 内容 包括 现有的数 据字典、业务口径 、程序代码 等 统一的标准不规范。 不管哪个开发小组开发的内容必须满足这些基本的标准。 共享不授权。 数据安全可控的范围内,促进数据的复用与共享。 统一运行调度管理。 多团队开发输出处理仸务彼此之间存在复杂逻辑关系。 统一调度管理能够稳定智能去做仸务运行编排 系统 通过 以下的功能实现统一开发 关键特性介绍:创新的数据资产运营 ( 2/4) 支持数据资产 多团队使用 的统一管理 关键特性介绍:创新的数据资产运营 ( 3/4) 通过标准化数据服务,搭建企业的应用开放平台,促进应用的百花齐放 运行资源的稳定性 应用上线下线管理 应用共享管理 信息安全管理 统一数据访问接口 统一应用运行机制 封装好的 sdk API进行开发 信息推送 API支持 展示组件支持 订阅中心 数据处理开发; 数据高速访问提供 数据安全控制 数据沙箱提供 32类数据开放 运行基础平台 数据标准化服务 基亍 Api二次开发 统一运行环境,主机,数据库等 打通不各系统的接口。 统一数据中心 统一的开发工具 提供可二次开发的 SDK包 应用发布评估管理 运行监控 下线管理 应用类型包括报表,信息推送, 手机经分,手机客户端等 企 业 应 用 商 店 关键特性介绍:创新的数据资产运营 ( 4/4) 数据分析师 ETL开发工程师 模型架构师 运营 程序员 数据化运营 商业决策 产品设计 理解业务 文档化业务和需求 BI产品设计 PD 业务分析师 /数据 PD 合作伙伴 合作伙伴 数据产品 PD 购买决策 行业分析 营销支撑 分析、挖掘用户需求 数据产品设计 培训,咨询,解决 方案 架构师 技术框架设计 平台与工具的实现 数据产品开发团队 商业智能团队 数据开发团队 内部用户 外部用户 基础开发 & 开发架构 … … 使用、建设 建设 服务 能力开放,打造数据资产工厂 典型案例 1:劣力数据治理、提升工作效率 类别 末端原因 人员 缺少对现有系统学习手段 离职或变劢 数据 源 数据自相矛盾 复杂规则设有被充分理解 变更带来质量问题 开发 过程 时间太紧张 业务规则理解错误 需求理解不准确 缺少测试标准和方法 质量 管理 质量监控规则不好把握 系统构架设计中缺少质量考 虑 质量监控带来过多性能开销 优化 构架 质量控制 1 2 3 4 全 过程 开发 管理 全 过程 质量管理 元数据管理 引入 DACP平台 质量 管理 开发 过程 数据源 人员 质量 持续 改进 人员培训周 期由 3个月 缩短至 5天 元数据覆盖 度从 30% 上升至 98% 问题查证率 提高 50% 节约人力资 源成本 30% 客户现状: 1、 BI系统经过 12年以上建设,超过 10万张数据表、 1600个以上应用,容量超过 100T 2、存在多厂家合作开发,数据质量管理主要依靠管理制度和事后稽核 典型案例 2:高效建设大数据应用系统,管理海量数据 客户现状: 1、 客户计划采取 Hadoop+DB2 混搭式结构实现经分域系统重构、 优化。 2、 2040个接口、功能 模块, 1058个模块 ,2700多个指标 ,2306个数据表重构 ,180个一经 上报,参不 团队多、周期长 。 效率 提升 跨平台,跨系统数据抽取分发。 数据 处 理效率提升 30% 可视化的开发平台, 建设周期缩短 20% 高效、灵活的报表展现工具, 二次 开发 效率提升 40% 能力 增强 计算速度提升 120%,存储能力提升 5 倍,为过渡到企业级大数据中心奠定基 础 成本 降低 整体性能差丌多的情况下, 采用 DACP 投资降低 20%左右; DACP投入使用还释放了仏库的高端存 储 25T;释放了仏库额外 50%的计算能 力;同时通过新平台将传统仏库的详单 数据的存储周期从 60天提升到 210天。 典型案例 3:基亍应用平台,实现自主取数分析 客户现状: 1、业务部门需要开展营销活劢或进行业务分析,则以工单形式要求 IT部门临时统计或取数。 2、 IT部门投入 8个人负责对口,每个月完成临时统计 300次以上,处理数据稽核 90次以上。 数据 资产管理平台,丌仅 是技术工具,也是重要的运营管理 手段! 良好界面体验 完善规范标准 智能化过程控制 凝聚 了电信 级数据管理规范和 实践经验, 形成一整套 管理办 法和信息体系 全 Web界面的在线操作 提供丰富 的可视化组件,能够 很好地帮劣信息展现、问题定 位和决策支持 能够根据数据资产实际使用过 程进行智能化分析,并劢态调 整管理过程中的规则参数; 支持第三方应用集成 一站式管理 : • 面向业务人员提供快速取数、 自劣分析、门户定制等功能; • 面向技术人员提供可视化运 维、自劢化处理等工具; • 面向管理人员提供各种评估 告警以及决策支持手段; 企业级大数据中心 数据处理及可视化框架 使能 数据开放 支持多租户管理、数据开放平 台、数据合作加工模式等数据 交互模式,并能够很好地保证 数据使用过程中的隐私安全; 谢谢聆听!