基本信息
- 商品名:{正版新书}数据仓库与数据挖掘实践97871□1□449□6
- ISBN:9787121244926
- 定价:48
- 出版社:电子工业出版社
- 作者:李春葆,李石君,李筱驰
参考信息(以实物为准)
- 出版时间:2014-11-01
- 印刷时间:2014-11-01
- 版次:1
- 印次:1
- 包装:平装
- 开本:16开
- 用纸:胶版纸
- 页数:355
- 字数:588800
编辑推荐
《数据仓库与数据挖掘实践》力求繁中取简,让读者易学易懂:信息系统安全等级保护标准比较多,覆盖了等级保护的各个阶段,并且对每个保护等级都做了详细的规定和描述,阅读起来难免有些眼花缭乱,不易理解和掌握。本书对相关标准进行了梳理,主要以第三级系统安全保护为主线来介绍等级保护的原理和方法,为进一步掌握和运用相关标准打下良好的基础。
内容简介
《数据仓库与数据挖掘实践》系统地介绍了数据仓库和数据挖掘技术,全本由两部分组成,□□章到第3章介绍数据仓库的基本概念和相关技术,第4章到□□1章介绍数据挖掘的基本概念和各种算法,包括数据仓库构建、OLAP技术、分类方法、聚类方法、关联分析、序列模式挖掘方法、回归和时序分析、粗糙集理论、文本挖掘、Web挖掘和空间数据挖掘方法等。
《数据仓库与数据挖掘实践》既注重原理,又注重实践,配有大量图表、示例和练习题,内容丰富,概念讲解清楚,表达严谨,逻辑性强,语言精练,可读性好。
《数据仓库与数据挖掘实践》既便于教师课堂讲授,又便于自学者阅读。适合作为高等院校高年级学生和研究生“数据仓库和数据挖掘”或“数据挖掘算法”课程的教材。
目录
□□章 数据仓库概述
1.1 数据仓库及其历史
1.1.1 数据库技术的发展
1.1.□ 什么是数据仓库
1.□ 数据仓库系统及其开发工具
1.□.1 数据仓库系统的组成
1.□.□ ETL
1.□.3 数据仓库和数据集市的关系
1.□.4 元数据及其管理
1.3 数据仓库系统开发工具
1.4 数据仓库与操作型数据库的关系
1.4.1 从数据库到数据仓库
1.4.□ 数据仓库为什么是分离的
1.4.3 数据仓库与操作型数据库的对比
1.4.4 ODS
1.5 商务智能与数据仓库的关系
练习题1
思考题1
第□章 数据仓库设计
□.1 数据仓库设计概述
□.1.1 数据仓库设计原则
□.1.□ 数据仓库构建模式
□.1.3 数据仓库设计步骤
□.□ 数据仓库的规划和需求分析
□.□.1 数据仓库的规划
□.□.□ 数据仓库的需求分析
□.3 数据仓库的建模
□.3.1 多维数据模型及相关概念
□.3.□ 多维数据模型的实现
□.3.3 数据仓库建模的主要工作
□.3.4 几种常见的基于关系数据库的多维数据模型
□.4 数据仓库的物理模型设计
□.4.1 确定数据的存储结构
□.4.□ 确定索引策略
□.4.3 确定存储分配
□.5 数据仓库的部署和维护
□.5.1 数据仓库的部署
□.5.□ 数据仓库的维护
□.6 一个简单的数据仓库SDWS设计示例
□.6.1 SDWS的需求分析
□.6.□ SDWS的建模
□.6.3 基于SQLServer□008设计SDWS
练习题□
思考题□
第3章 OLAP技术
3.1 OLAP概述
3.1.1 什么是OLAP
3.1.□ OLAP技术的特性
3.1.3 OLAP和OLTP的区别
3.1.4 数据仓库与OLAP的关系
3.1.5 OLAP分类
3.□ OLAP的多维数据模型
3.□.1 多维数据模型的定义
3.□.□ OLAP的基本分析操作
3.□.3 一个简单的多维数据模型
3.3 OLAP实现
3.3.1 数据立方体的有效计算
3.3.□ 索引OLAP数据
3.3.3 OLAP查询的有效处理
练习题3
思考题3
第4章 数据挖掘概述
4.1 什么是数据挖掘
4.1.1 数据挖掘的定义
4.1.□ 数据挖掘的知识表示
4.1.3 数据挖掘的主要任务
4.1.4 数据挖掘的发展
4.1.5 数据挖掘的对象
4.1.6 数据挖掘的分类
4.1.7 数据挖掘与数据仓库及OLAP的关系
4.1.8 数据挖掘的应用
4.□ 数据挖掘系统
4.□.1 数据挖掘系统的结构
4.□.□ 数据挖掘系统的设计
4.□.3 常用的数据挖掘系统及其发展
4.3 数据挖掘过程
4.3.1 数据挖掘步骤
4.3.□ 数据清理
4.3.3 数据集成
4.3.4 数据变换
4.3.5 数据归约
4.3.6 离散化和概念分层生成
4.3.7 数据挖掘的算法
4.4 数据挖掘的未来展望
练习题4
思考题4
第5章 关联分析
5.1 关联分析的概念
5.1.1 事务数据库
5.1.□ 关联规则及其度量
5.1.3 频繁项集
5.1.4 挖掘关联规则的基本过程
5.□ Apriori算法
5.□.1 Apriori性质
5.□.□ Apriori算法
5.□.3 由频繁项集产生关联规则
5.□.4 提高Apriori算法的有效性
5.□.5 非二元属性的关联规则挖掘
5.3 频繁项集的紧凑表示
5.3.1 □大频繁项集
5.3.□ 频繁闭项集
5.4 FP-growth算法
5.4.1 FP-growth算法框架
5.4.□ FP树构造
5.4.3 由FP树产生频繁项集
5.5 多层关联规则的挖掘
5.5.1 多层关联规则的挖掘概述
5.5.□ 多层关联规则的挖掘算法
5.5.3 多维关联规则
5.6 其他类型的关联规则
5.6.1 基于约束的关联规则
5.6.□ 负关联规则
5.7 SQLServer挖掘关联规则的示例
5.7.1 建立DM数据库
5.7.□ 建立关联挖掘项目
5.7.3 部署关联挖掘项目并浏览结果
练习题5
思考题5
第6章 序列模式挖掘
6.1 序列模式挖掘概述
6.1.1 序列数据库
6.1.□ 序列模式挖掘算法
6.□ Apriori类算法
6.□.1 AprioriAll算法
6.□.□ AprioriSome算法
6.□.3 DynamicSome算法
6.□.4 GSP算法
6.□.5 SPADE算法
6.3 模式增长框架的序列挖掘算法
6.3.1 FreeSpan算法
6.3.□ PrefixSpan算法
练习题6
思考题6
第7章 分类方法
7.1 分类过程
7.1.1 学习阶段
7.1.□ 分类阶段
7.□ k-□邻近分类算法
7.3 决策树分类算法
7.3.1 决策树
7.3.□ 建立决策树的ID3算法
7.3.3 建立决策树的C4.5 算法
7.4 贝叶斯分类算法
7.4.1 贝叶斯分类概述
7.4.□ 朴素贝叶斯分类
7.4.3 树增强朴素贝叶斯分类
7.5 神经网络算法
7.5.1 生物神经元和人工神经元
7.5.□ 人工神经网络
7.5.3 前馈神经网络用于分类
7.5.4 SQLServer中神经网络分类示例
7.6 支持向量机
7.6.1 线性可分时的二元分类问题
7.6.□ 线性不可分时的二元分类问题
练习题7
思考题7
第8章 回归分析和时序挖掘
8.1 线性和非线性回归分析
8.1.1 一元线性回归分析
8.1.□ 多元线性回归分析
8.1.3 非线性回归分析
8.□ 逻辑回归分析
8.□.1 逻辑回归原理
8.□.□ 逻辑回归模型
8.□.3 SQL Server中逻辑回归分析示例
8.3 时序分析模型
8.3.1 时序分析概述
8.3.□ 时序预测的常用方法
8.3.3 回归分析与时序分析的关系
8.3.4 确定性时序模型
8.3.5 随机时序模型
8.3.6 SQL Server建立随机时序模型示例
8.4 时序的相似性搜索
8.4.1 相似性搜索的概念
8.4.□ 完全匹配
8.4.3 基于离散傅里叶变换的子序列匹配
8.4.4 基于规范变换的子序列匹配
练习题8
思考题8
第9章 粗糙集理论
9.1 粗糙集理论概述
9.1.1 粗糙集理论的产生
9.1.□ 粗糙集理论的特点
9.1.3 粗糙集理论在数据挖掘中的应用
9.□ 粗糙集理论中的基本概念
9.□.1 集合的基本概念
9.□.□ 信息系统和粗糙集
9.□.3 分类的近似度量
9.3 信息系统的属性约简
9.3.1 约简和核
9.3.□ 分辨矩阵求核
9.4 决策表及其属性约简
9.4.1 决策表及相关概念
9.4.□ 决策表的属性约简算法
9.5 决策表的值约简及其算法
9.5.1 决策规则及其简化
9.5.□ 决策规则的极小化
9.6 粗糙集在数据挖掘中的应用示例
练习题9
思考题9
□□0章 聚类方法
10.1 聚类概述
10.1.1 什么是聚类
10.1.□ 相似性测度
10.1.3 聚类过程
10.1.4 聚类算法的评价
10.1.5 聚类方法的分类
10.1.6 聚类分析在数据挖掘中的应用
10.1.7 聚类算法的要求
10.□ 基于划分的聚类算法
10.□.1 k-均值算法
10.□.□ k-中心点算法
10.3 基于层次的聚类算法
10.3.1 层次聚类算法概述
10.3.□ DIANA算法和AGNES算法
10.3.3 BIRCH算法
10.3.4 CURE算法
10.3.5 ROCK算法
10.3.6 Chameleon算法
10.4 基于密度的聚类算法
10.4.1 DBSCAN算法
10.4.□ OPTICS算法
10.5 基于网格的聚类算法
10.5.1 STING算法
10.5.□ Wave Cluster算法
10.5.3 CLIQUE算法
10.6 基于模型的聚类算法
10.6.1 EM算法
10.6.□ COBWEB算法
10.7 离群点分析
10.7.1 离群点概述
10.7.□ 常见的离群点检测方法
练习题10
思考题10
□□1章 其他挖掘方法
11.1 文本挖掘
11.1.1 文本挖掘概述
11.1.□ 数据预处理技术
11.1.3 文本结构分析
11.1.4 文本分类
11.1.5 文本聚类
11.1.6 文本摘要
11.1.7 文本关联分析
11.□ Web挖掘
11.□.1 Web挖掘概述
11.□.□ Web结构挖掘
11.□.3 Web内容挖掘
11.□.4 Web使用挖掘
11.□.5 Web挖掘的发展方向
11.3 空间数据挖掘
11.3.1 空间数据概述
11.3.□ 空间数据立方体和空间OLAP
11.3.3 空间数据挖掘方法
练习题11
思考题11
附录A常用的优化方法
参考文献
作者简介
李春葆,武汉大学计算机学院教授,主持和参加3S系统集成关键技术的研究(国家自然科学基金重点科技攻关项目,49631050)、城市地理信息系统标准规范的研究(国家测绘局项目)、伊藤算法及其在动态仿真优化中的理论研究(60873114/F0□010□)、湖北省财政厅三查管理信息系统、湖北省财政厅外汇管理信息系统、湖北省财政厅财政监督管理信息系统、武汉英华ERP系统等项目。