书籍详情
《统计分析与数据挖掘技术》[29M]百度网盘|亲测有效|pdf下载
  • 统计分析与数据挖掘技术

  • 出版社:清华大学出版社
  • 出版时间:2019-12
  • 热度:4500
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

内容简介

  《统计分析与数据挖掘技术》介绍了统计学的常用基本概念及数据收集与处理技术,从传统统计学的角度讲述了数据描述性分析、数据分析理论及方法,详细介绍了多元统计分析的基本统计思想和相关理论,为数据挖掘算法的研究提供了必要的理论支持,为读者查阅基本概念和基本理论提供方便。
  《统计分析与数据挖掘技术》还考查了数据挖掘的任务、数据流模型与分类及数据流概要描述方法,介绍了数据挖掘的基本理论和常用算法,如分类、聚类及关联规则等数据挖掘算法,为初学者提供了必要的科普知识。
  《统计分析与数据挖掘技术》分4篇,第1篇阐述了大数据的相关知识;第2篇阐述了统计基础和数据统计分析相关内容;第3篇阐述了多元统计分析的基本统计思想和相关理论;第4篇阐述了数据挖掘技术的分类、聚类及关联规则的算法。
  《统计分析与数据挖掘技术》将统计理论与大数据挖掘技术融合起来,让统计理论更好地服务于大数据时代,对统计理论在大数据时代下的可持续发展和研究做了尝试。
  《统计分析与数据挖掘技术》可作为普通高等院校大数据相关专业本科生和研究生的参考教材,也可以作为数据统计分析与数据挖掘技术研究人员的自学教材。

内页插图

目录

第1篇 大数据时代
第1章 大数据概述
1.1 指数时代
1.2 大数据特征和价值
1.2.1 大数据特征
1.2.2 大数据价值
1.3 大数据研究现状和发展动态
1.3.1 大数据研究现状
1.3.2 大数据研究发展动态
1.4 大数据研究存在的主要问题
1.4.1 大数据技术存在的问题
1.4.2 研究方法问题
1.4.3 领域融合问题
1.5 大数据时代统计学重构意义
1.5.1 对大数据的初步认识
1.5.2 统计思维变化
1.5.3 大数据时代下统计学重构

第2篇 传统统计分析方法
第2章 统计基础
2.1 统计学基本概念
2.1.1 统计学及统计工作过程
2.1.2 总体和样本
2.1.3 标志与变量
2.1.4 统计指标和指标体系
2.2 数据收集处理与数据描述
2.2.1 数据来源
2.2.2 数据质量
2.2.3 数据预处理
2.2.4 数据分组
2.2.5 频数分布
2.2.6 数据显示
2.3 数据描述性统计分析
2.3.1 数据对比分析
2.3.2 集中趋势测量
2.3.3 离散趋势测量
第3章 数据统计分析
3.1 参数估计
3.1.1 抽样推断与抽样分布
3.1.2 参数估计基本方法
3.1.3 总体均值区间估计
3.1.4 正态总体方差的区间估计
3.1.5 总体成数区间估计
3.1.6 样本容量确定
3.2 假设检验
3.2.1 假设检验基本问题
3.2.2 总体平均数检验
3.2.3 正态总体方差假设检验
3.2.4 总体成数检验
3.3 方差分析
3.3.1 方差分析概念和意义
3.3.2 单因素方差分析
3.3.3 无交互作用的双因素方差分析
3.4 相关与回归分析
3.4.1 相关分析
3.4.2 一元线性回归
3.4.3 多元线性回归
3.4.4 非线性回归
……

第3篇 多元统计分析及其方法
第4篇 数据挖掘技术

参考文献

前言/序言

  大数据(Big Data)是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。现代社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。早在1980年,著名未来学家阿尔文·托夫勒在《第三次浪潮》一书中将大数据称为“第三次浪潮华彩乐章”。英国维克托·迈尔,舍恩伯格教授编写的被尊为国外大数据研究先河之作《大数据时代》中阐述了所谓大数据就是“所有数据”。进入2012年,“大数据”一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低,人们所掌握的数据量越来越大,但我们关心的不是数据本身,真正关心的是在这如此巨大的数据中我们可以得到什么样的信息,可以得到多少有用的信息,这就是数据挖掘理论所要研究的问题。
  本书讲述的是在大数据时代下的统计学理论以及数据挖掘的基本概念和技术。
  过去由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差,统计结果往往不能重复使用,造成数据利用率低,而现在则可以做到“样本=总体”。“小数据”时代,一个样本的错误就可以造成对总体估计的失误,而“大数据”时代对精确性的要求不再那么苛刻,数据的数量足以弥补这一缺陷。大数据时代,人们应该从追求“因果关系”的旧思维方式向追求“相关关系”转变,这实际上是通过大数据来透视一种事物的发展趋势。但很多精确学科领域依然需要探寻“因果关系”,解决更有针对性的问题,所以从追求“因果关系”到追求“相关关系”的转变只能局限在特定的领域发生。也就是说,大数据的相关性将人们指向了比探讨因果关系更有前景的领域。