本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
随着各行各业对大数据实时查询的需求持续增长,数据查询及分析引擎正变得不可或缺。Presto是由Facebook开源的高性能分布式SQL查询引擎,其用户包括Netfli、Airbnb、LinkedIn、Twitter、Uber等公司。本书由Presto的核心开发人员参与撰写,教你系统地学习Presto的用法。书中内容涵盖Presto的安装、设计理念、查询作、*佳实践、与主要云平台的结合等。本书分为三大部分:*一部分介绍Presto的基础知识;*二部分更进一步,介绍Presto架构、集部署、与数据源的连接等;三部分讲解安全配置以及Presto的实际用例。你可以通过本书学会针对不同的数据源快速执行交互式SQL数据分析,并利用Presto管理和使用海量数据。
马特·富勒(Matt Fuller) Starburst公司联合创始人。 曼弗雷德·莫泽(Manfred Moser) 开源社区拥护者、技术作家、培训师,Starburst公司软件工程师。 马丁·特拉韦尔索(Martin Traverso) Presto项目创始成员,Presto软件基金会联合创始人,Starburst公司&席技术官。 【译者简介】 张晨 毕业于上海交通大学,热爱大数据技术、数据库、分布式系统和函数式编程,现于Indeed东京担任软件工程师。 黄鹏程 毕业于北京邮电大学,专注于数据库和大数据平台的开发与架构工作。曾就职于中国民生银行,担任大数据基础架构团队负责人。现任阿里云*级产品专家,负责阿里云数据库相关产品的设计与规划工作。 傅宇 毕业于南京大学,专注于数据库技术,现任阿里云技术专家,担任PolarDB-X云原生分布式数据库内核研发工作,熟悉分布式事务、查询优化器和执行器,对大数据领域充满热情。
译者序 v
序 vii
前言 i
一部分 Presto 入门
1章 Presto 介绍 3
1.1 大数据带来的问题 3
1.2 Presto来救场 4
1.2.1 为性能和规模而生 5
1.2.2 SQL-on-Anything 5
1.2.3 存储与计算分离 6
1.3 Presto使用场景 6
1.3.1 单一的SQL分析访问点 7
1.3.2 数据仓库和数据源系统的访问点 7
1.3.3 提供对任何内容的SQL访问 8
1.3.4 联邦查询 9
1.3.5 虚拟数据仓库的语义层 9
1.3.6 数据湖查询引擎 9
1.3.7 SQL转换和ETL10
1.3.8 更快的响应带来更好的数据见解 10
1.3.9 大数据、机器学习和人工智能 10
1.3.10 其他使用场景 11
1.4 Presto 资源 11
1.4.1 官方网站 11
1.4.2 文档 12
1.4.3 社区交流 12
1.4.4 源代码、许可证和版本 12
1.4.5 贡献 12
1.4.6 本书资源 13
1.4.7 鸢尾花数据集 13
1.4.8 航班数据集 14
1.5 Presto简史 14
1.6 小结 15
2章 安装和配置Presto 16
2.1 使用Docker容器尝试Presto 16
2.2 使用归档文件安装 17
2.2.1 JVM 17
2.2.2 Python 18
2.2.3 安装 18
2.2.4 配置 19
2.3 添加数据源 20
2.4 运行Presto 21
2.5 小结 21
3章 使用Presto 22
3.1 Presto CLI 22
3.1.1 使用入门 22
3.1.2 分页 25
3.1.3 命令历史 25
3.1.4 额外诊断 25
3.1.5 执行查询 25
3.1.6 输出�