数据质量征途pdf下载pdf下载

数据质量征途百度网盘pdf下载

作者:
简介:本篇主要提供数据质量征途pdf下载
出版社:高等教育出版社
出版时间:2015-07
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

  《数据质量征途》是“大数据科学”丛书的首册,编译自合作编著的《Journey to Data Quality》,四位作者均为国际数据质量研究的先驱,该书堪称数据质量领域的经典之作。
  《数据质量征途》从数据质量的概念入手,结合案例和分析工具,深入浅出地总结了美国学术界和产业界十余年的成果和经验,具有很强的指导性和实用性。《数据质量征途》其12章,内容包括对数据质量概念的翔实介绍,对数据质量项目案例的深入剖析,以及信息产品地图等数据质量分析工具的应用指南。无论是对初窥门径的学生,还是对有多年工作经验的实践者,《数据质量征途》都有极高的参考价值。
  “大数据科学”丛书涉及大数据理论、技术、产业和管理的方方面面,旨在帮助相关领域的学者,特别是产业界了解世界大数据研究和应用的前沿,也可以作为教学之用。

目录

第1章 引言
1.1 信息可以被共享吗
1.2 新系统不是解决办法
1.3 开启数据质量之旅
1.4 成功开始的故事
1.5 CEO领导的旅程
1.6 数据质量之旅面临的挑战
1.7 数据质量为什么重要
1.8 本书概览

第2章 成本一效益分析
2.1 挑战性
2.2 成本一收益的权衡
2.3 一个案例
2.4 高级成本一效益分析技术
2.5 本章小结

第3章 数据质量评估(一)
3.1 评估技术和相关方法
3.2 实际中的评价方法
3.3 差距分析技术
3.4 数据完整性评价
3.5 本章小结
附录数据质量评价调查(IQA)问卷

第4章 数据质量评估(二)
4.1 科德完整性约束
4.2 数据质量指标
4.3 自动化的测量方法
4.4 嵌入过程的数据整体性方法
4.5 本章小结

第5章 保证信息质量的抽样方法
5.1 基本概念
5.2 选择抽样过程
5.3 确定样本量
5.4 交易数据库的抽样
5.5 环境扩展:分布式数据库和数据仓库
5.6 本章小结

第6章 数据质量问题及其模式剖析
6.1 数据质量问题的十大根源
6.2 数据质量问题的表现
6,3数据质量问题的转换
6.4 本章小结

第7章 识别数据质量问题的根本原因——一个医疗保健组织案例
7.1 案例:好感觉健康系统公司(Feelwell Health Systems)
7.2 识别问题
7.3 组建跨部门的团队
7.4 采用一种框架:建立并测试假设
7.5 关键信息
7.6 找出数据质量问题的诱因
7.7 本章小结

第8章 信息的产品化管理
8.1 信息产品
8.2 四个案例
8.3 四个原则
8.4 把信息当成副产品来管理是无效的
8.5 本章小结
……
第9章 开发信息产品地图
第10章 数据质量实践——一家大型教学医院的案例
第11章 数据质量政策
第12章 旅途结束了吗
附录 一种基于期望失验理论的信息质量评估指标体系
参考文献

精彩书摘

  《数据质量征途》:
  具体到一个组织的数据质量政策,首先可以确定的是数据质量政策的总目标:数据质量政策必须能够促使数据质量全面、持续的改善。这其中需要解决的问题会有很多,有一些可能涉及业务领域和业务流程;而另一些则可以归纳为信息技术的完善和升级;为了确保企业能够在生产中使用高质量的数据,组织以外的某些政策可能也要改变,等等。然而,哪些方面是最重要的呢?为了回答这个问题,组织有必要建立相应的措施来评估各项政策的重要性和有效性。
  第二个关键问题是由谁负责制定政策。首先要明确的是,数据质量政策应该源自公司的业务,而决非信息技术供应商。虽然信息技术部门关注的数据备份、数据恢复、数据一致性,以及数据的审计机制等问题都有助于改善数据质量,但是在制定组织的数据质量政策时,组织必须具有一个更为广泛且代表业务需求的视角。
  在制定数据质量政策时,必须清楚地识别管理数据的不同角色,并且明确规定每个角色的职责和各个角色之间的关系。就数据本身而言,当务之急是识别对组织起关键作用的数据元素;就组织的全部业务功能而言,则是寻找一个能够涵盖其所代表的现实意义和价值观的视角。
  下面将列出推荐的数据质量政策的十大政策指引。这十项指引是在观察和总结之前研究和实践中发现的数据质量问题,分析对应的改善措施及其演变历程的过程中总结得来的。
  ①组织必须遵循的一项基本原则是:将信息视为产品,而非通过产品传递信息;
  ②组织应该把收获和保持数据质量成果的工作纳,入业务日程;
  ③组织应该确保其数据质量政策及其具体的程序与组织的企业战略、经营方针和业务流程保持一致;
  ④组织应该将服务于数据质量的角色及其职责作为组织架构的一部分来考虑和设计;
  ⑤组织必须确保数据架构与组织架构是一致的;
  ⑥组织有必要积极主动地调整管理策略以应对数据需求的变化;
  ⑦组织应该设计和实施符合实际情况的数据标准;
  ⑧组织必须有可行的策略和务实的做法来识别和解决数据质量问题,并且采取有效的手段定期审计数据质量和数据质量环境;
  ⑨组织有必要营造一个利于学习和创新数据质量活动的环境;
  ⑩组织有必要建立一种机制来协调利益相关方之间的分歧和冲突。
  1.将信息视为产品,而非通过产品传递信息
  信息与产品的关系原则是数据质量政策指引的核心,也是后续九条政策指引的基础。在整个组织中,对于这一至关重要的原则必须达成共识,并且很有必要通过反复不断的传达,使之真正成为组织的一条理念。如果不能坚持这个核心原则,则其他任何试图改进数据质量的努力都将成为过眼云烟,是难以获得长期的、可衡量的益处的。
  2.把收获和保持数据质量成果的工作纳入业务日程
  为了确保数据质量政策的有效性,组织必须把建立和保持数据质量的各项工作纳入业务日程。要做到这一点,组织必须真正地理解数据在其业务战略和运营中扮演的重要角色,特别是与业务职能直接相关的数据(如,用来完成企业运营、商业战术以及战略任务的数据)对于组织竞争力的产生所发挥的根本性作用。由此可见,将数据质量政策规划的职责简单地划归信息技术部门显然是不恰当的。
  确保数据质量纳入业务日程的关键还在于高级管理人员的作为。高级管理人员有责任积极、主动地履行领导作用,积极地参与和保障与组织的数据质量相关的各项工作。此处需要指出的是,高级管理人员的领导工作及其领导力是数据质量工作成功与否的关键。
  与此同时,在提高数据质量的过程中,组织有可能会发觉一些在业务流程中或者其他方面能够改善的领域,甚至发掘出尚未被察觉的关键业务流程。显然,这些积极的事件都会有助于,甚至是显著地提升公司的地位和竞争力。所以,高级管理人员必须主动、全面地深入到改善数据质量和保持数据质量成果的各项努力中去。
  ……