R语言数据分析与挖掘pdf下载pdf下载

R语言数据分析与挖掘百度网盘pdf下载

作者:
简介:本篇主要提供R语言数据分析与挖掘pdf下载
出版社:
出版时间:2020-08
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

  现在,越来越多的人考虑引入大数据技术来促进公司产品的销售以获得更多的利润。而学习算法能让商务活动及其发展过程的预测摆脱人脑计算能力的局限,并且能提高数据模型的预测精确度,使得大数据的分析处理在依托计算机的大规模计算能力下得以完成。
  当前数据分析非常常用的工具就是R语言,《R语言数据分析与挖掘》深入浅出地介绍了利用R语言进行数据分析及构建预测模型的多种实用方法,包括回归、聚类、关联和分类分析等常用学习算法的实现,每一种算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。《R语言数据分析与挖掘》还系统讲解了相关的R语言的基础知识,包括环境准备以及数据转换、分析和结果可视化的方法等。
  《R语言数据分析与挖掘》融合了作者十几年来利用数据分析算法来实现数据挖掘与分析的诸多心得,书中所有的源代码和实验数据以及习题和答案在出版社网站上都可以免费下载。阅读完《R语言数据分析与挖掘》并亲自动手完成书中所有算法案例后,读者对数据分析将会有更深入的了解。
  《R语言数据分析与挖掘》既可以作为相关专业数据分析类课程的教材,也可以作为大数据网络培训或技术人员自学的参考资料。

内页插图

目录

第1章 初识数据分析与R语言
1.1 软件下载与安装
1.1.1 下载和安装
1.1.2 下载和安装RStudio
1.2 包的安装和加载
1.3 应用R实现数据操作
1.3.1 数据读写
1.3.2 数据基本操作
1.3.3 应用简单统计
1.3.4 数据可视化
习题

第2章 回归分析
2.1 简单线性回归分析
2.1.1 调用lm函数构建简单线性回归模型
2.1.2 输出线性模型的特征信息
2.1.3 使用线性回归模型预测未知数
2.1.4 生成模型的诊断图
2.2 多项式回归分析
2.2.1 利用lm函数生成多项式回归模型
2.2.2 调用rlm函数生成稳健线性回归模型
2.3 在SLID数据集上研究线性回归案例
习题

第3章 关联分析
3.1 关联分析的准备工作
3.1.1 将数据转换成事务数据
3.1.2 展示事务及其关联
3.2 Apriori规则
3.2.1 使用Apriori规则完成关联挖掘
3.2.2 去掉冗余规则
3.3 关联规则可视化
3.4 Eclat挖掘
3.4.1 使用Eclat挖掘频繁项集
3.4.2 生成时态事务数据
3.5 使用cSPADE挖掘频繁时序模式
习题

第4章 聚类分析
4.1 层次聚类
4.1.1 使用层次聚类处理数据
4.1.2 将树分成簇
4.2 k均值聚类
4.2.1 使用k均值方法处理数据
4.2.2 绘制二元聚类图
4.3 聚类算法比较
4.4 聚类效果评估
4.4.1 从簇中抽取轮廓信息
4.4.2 获得优化的k值聚类
4.5 使用密度聚类方法处理数据
习题
……

第5章 决策树
第6章 神经网络与支持向量机
第7章 模型评估

附录 习题库
参考文献

前言/序言

  在举世瞩目的十九大报告中,习近平总书记提出:“加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合……”自从2014年大数据首次写入政府工作报告,大数据逐渐成为各级政府关注的热点。2015年9月,国务院印发《促进大数据发展行动纲要》,系统部署了我国大数据发展工作,至此,大数据成为国家级的发展战略。2017年1月,工信部编制印发《大数据产业发展规划(2016-2020年)》。2019年12月8日下午在中共中央政治局就实施国家大数据战略进行第二次集体学习会议中,中共中央总书记习近平在主持学习时强调,大数据发展日新月异,我们应该加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好地服务于我国经济社会发展和人民生活改善。
  为对接大数据国家发展战略,教育部批准于2017年开办高职大数据技术与应用专业,2017年全国共有64所职业院校获批开办该专业,2020年全国619所高职院校成功申报大数据技术与应用专业,该专业已经成为高职院校最火爆的新增专业。
  为培养满足经济社会发展需要的大数据人才,加强粤港澳大湾区区域内高职院校的协同育人和资源共享,2018年6月,在广东省人才研究会的支持下,由广州番禺职业技术学院牵头,联合深圳职业技术学院、广东轻工职业技术学院、广东科学技术职业学院、广州市大数据行业协会、佛山市大数据行业协会、香港大数据行业协会、广东职教桥数据科技有限公司、广东泰迪智能科技股份有限公司等200余家高职院校、协会和企业,成立了广东省人才研究会大数据产教联盟,联盟先后开展了大数据产业发展、人才培养模式、课程体系构建、深化产教融合等主题研讨活动。
  课程体系是专业建设的顶层设计,教材开发是专业建设和三教改革的核心内容。为了贯彻党的十九大精神,普及和推广大数据技术,为高职院校人才培养做好服务,西安电子科技大学出版社在广泛调研的基础上,结合自身的出版优势,联合广东省人才研究会大数据产教联盟策划了“高职高专大数据技术与应用专业系列教材”。