Spark高级数据分析 pdf下载

出版社文轩网旗舰店

出版年 2018-06

页数 390页

装帧精装

评分 9.2(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供Spark高级数据分析电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

作者:(美)桑迪·里扎(Sandy Ryza) 等著；龚少成,邱鑫译

定价:69

出版社:人民邮电出版社

出版日期:2018年06月01日

页数:226

装帧:平装

ISBN:9787115482525

●推荐序 ix
●译者序
●序ii
●前言xv
●章大数据分析1
●1.1数据科学面临的挑战2
●1.2认识Apache Spark4
●1.3关于本书5
●1.4第 2版说明6
●第2章用Scala 和Spark 进行数据分析8
●2.1数据科学家的Scala9
●2.2Spark编程模型10
●2.3记录关联问题10
●2.4小试牛刀：Spark shell和SparkContext11
●2.5把数据从集群上获取到客户端16
●2.6把代码从客户端发送到集群19
●2.7从RDD到DataFrame20
●2.8用DataFrame API来分析数据23
●2.9DataFrame的统计信息27
●2.10DataFrame的转置和重塑29
●部分目录

本书是使用Spark进行大规模数据分析的实战宝典，由数据科学家撰写。本书在靠前版的基础上，针对Spark近年来的发展，对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API，MLlib和Spark SQL子项目也发生了较大变化，本书为关注Spark发展趋势的读者提供了与时俱进的资料，例如Dataset和DataFrame的使用，以及与DataFrame API高度集成的Spark ML API。

(美)桑迪·里扎(Sandy Ryza) 等著；龚少成,邱鑫译

桑迪·里扎（Sandy Ryza），Spark项目代码提交者、Hadoop项目管理委员会委员，Time Series for Spark项目创始人。曾任Cloudera公司不错数据科学家，现就职于Remix公司从事公共交通算法开发。
于里·莱瑟森（Uri Laserson），MIT博士毕业，致力于用技术解决遗传学问题，曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。目前是西奈山伊坎医学院遗传学助理教授，曾任Cloudera公司核心数据科学家。
肖恩·欧文（Sean Owen），Spark、Mahout项目等

Spark高级数据分析 pdf下载

选择版本

内容简介

相关推荐

线性代数与数据学习

华为数字化转型与数据治理套装（套装共2册）

“体贴”的算法：数据如何重塑生活空间

数据中心暖通系统运维