《数据挖掘与预测分析》[48M]百度网盘|pdf下载|亲测有效
《数据挖掘与预测分析》[48M]百度网盘|pdf下载|亲测有效

数据挖掘与预测分析 pdf下载

出版社 科技生活自营旗舰店
出版年 2017-02
页数 390页
装帧 精装
评分 8.7(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供数据挖掘与预测分析电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

内容简介

  《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。
  《数据挖掘与预测分析(第2版)》的新内容:
  添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本.效益分析、缺失数据填补、聚类优劣度量以及细分模型等。
  针对前沿主题的新章节,例如,多元分类模型、BIRCH聚类、集成学习(bagging及boosting)、模型投票与趋向平均等。
  每章节后均附有R语言开发园地,读者可以获得完成书中分析所需的R语言源代码,以及通过R代码生成的图、表和结果。
  书中的附录为那些对统计基础生疏的读者提供了了解基本概念的材料。
  超过750个章节练习,使读者能够自己测试对所学知识的掌握程度,并着手开展数据挖掘与预测分析工作。
  《数据挖掘与预测分析(第2版)》将对数据分析人员、数据库分析人员以及CIO具有极大的吸引力,通过学习将使他们知道何种类型的分析将会增加其投资回报。

作者简介

  Daniel T.Larose,博士,美国中央康涅狄格州立大学数学科学教授,数据挖掘项目负责人。已出版与数据挖掘、Web挖掘和统计理论等相关论著多本。他也是《微软》、《福布斯》杂志以及《经济学人》杂志等数据挖掘与统计分析领域的顾问。
  
  Chantal D.Larose,美国康涅狄格大学的在读博士。其研究领域包括缺失数据填补以及基于模型的聚类等。她已获得美国新帕尔兹纽约州立大学商学院决策科学领域助理教授的职位。

内页插图

目录

第Ⅰ部分 数据准备
第1章 数据挖掘与预测分析概述
1.1 什么是数据挖掘和预测分析
1.2 需求:数据挖掘技术人员
1.3 数据挖掘离不开人的参与
1.4 跨行业数据挖掘标准过程:CRJSP-DM
1.5 数据挖掘的谬误
1.6 数据挖掘能够完成的任务
1.6.1 描述
1.6.2 评估
1.6.3 预测
1.6.4 分类
1.6.5 聚类
1.6.6 关联
R语言开发园地
R参考文献
练习
第2章 数据预处理
2.1 需要预处理数据的原因
2.2 数据清理
2.3 处理缺失数据
2.4 识别错误分类
2.5 识别离群值的图形方法
2.6 中心和散布度量
2.7 数据变换
2.8 min-max规范化
2.9 Z-score标准化
2.10 小数定标规范化
2.11 变换为正态数据
2.12 识别离群值的数值方法
2.13 标志变量
2.14 将分类变量转换为数值变量
2.15 数值变量分箱
2.16 对分类变量重新划分类别
2.17 添加索引字段
2.18 删除无用变量
2.19 可能不应该删除的变量
2.20 删除重复记录
2.21 ID字段简述
R语言开发园地
R参考文献
练习
第3章 探索性数据分析
3.1 假设检验与探索性数据分析
3.2 了解数据集
3.3 探索分类变量
3.4 探索数值变量
3.5 探索多元关系
3.6 选择感兴趣的数据子集作进一步研究
3.7 使用EDA发现异常字段
3.8 基于预测值分级
3.9 派生新变量:标志变量
3.10 派生新变量:数值变量
3.11 使用EDA探测相关联的预测变量
3.12 EDA概述
R语言开发园地
R参考文献
练习
第4章 降维方法
4.1 数据挖掘中降维的必要性
4.2 主成分分析
4.3 将主成分分析应用于房屋数据集
4.4 应提取多少个主成分
4.4.1 特征值标准
4.4.2 解释变异的比例标准
4.4.3 最小共性标准
4.4.4 坡度图标准
4.5 主成分描述
4.6 共性
4.7 主成分验证
4.8 因子分析法
4.9 因子分析法在成年人数据集中的应用
4.10 因子旋转
4.11 用户自定义合成
4.12 用户自定义合成的示例
R语言开发园地
R参考文献
练习
……

第Ⅱ部分 统计分析
第Ⅲ部分 分类
第Ⅳ部分 聚类
第Ⅴ部分 关联规则
第Ⅵ部分 增强模型性能
第Ⅶ部分 更多主题
第Ⅷ部分 案例研究:对直邮营销的响应预测
附录A 数据汇总与可视化

前言/序言

  《数据挖掘与预测分析(第2版)》一书从解决现实世界的问题出发,介绍了当前被广泛应用于现实世界数据集合中的数据挖掘和预测分析技术。本书对数据挖掘与预测分析的讲解是以数据准备、统计分析、分类、关联规则、强化模型性能、案例研究为线索,根据技术的适用情况,结合相应的案例开展研究工作,帮助读者了解并掌握各种算法的操作和细微差异,让读者真正理解算法思想和适用环境。
  本书提出的方法和技术全面、深入,几乎涵盖了当前应用中常见的各类挖掘与分析方法。对方法的介绍从概念、算法、评价等部分着手,深入浅出地加以介绍。在介绍方法的章节中增加了R语言开发园地,帮助读者利用R语言开展实际设计和开发工作,获得章节中涉及内容的结果,便于读者掌握所学内容。