数据科学的编程基础pdf下载pdf下载

数据科学的编程基础百度网盘pdf下载

作者:
简介:本篇主要提供数据科学的编程基础pdf下载
出版社:
出版时间:2019-11
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

本书在编写过程中,首先收集了全世界380多所院校的数据科学和大数据相关的人才培养方案,然后使用非结构数据分析技术挖掘出编程类课程的主要内容,进而形成本书的主要雏形。笔者在其编写的《Python数据分析基础》(第1版和第2版)的基础上对雏形进行了完善。本书针对数据分析领域中编程类课程教学过程中的突出问题进行了仔细斟酌和调整,力求内容生动、深入浅出、言简意赅。全书采用mac OS Mojave操作系统下的Python3.7和Anaconda2018.12的Jupyter Notebook作为分析环境(如果读者使用Windows系统,也可运行本书全部代码),希望读者参考本书的内容边做边学习。

作者简介

阮敬,首都经济贸易大学统计学院教授,博士,博士生导师。现任首都经济贸易大学研究生院副院长,北京市丰台区政协委员。教研领域:数据挖掘与数据分析、收入分配。

目录

目录



1数据科学与编程语言(1)


1.1数据科学与数据分析(1)


1.2程序及其基本特征(2)


1.3算法(3)


1.3.1算法的表示方法(4)


1.3.2算法评价(7)


1.4数据结构(8)


1.5编程语言(9)



1.5.1Python语言(9)



1.5.2R语言(9)



1.5.3SAS语言(10)



2程序设计基础知识(11)


2.1结构化程序设计(12)


2.2面向对象的程序设计(13)



2.2.1抽象(13)



2.2.2基本概念(14)



2.2.3基本特性(17)



3Python系统配置与基础知识(19)


3.1Python系统配置(19)


3.2Python基础知识(24)



3.2.1帮助(25)



3.2.2标识符(25)



3.2.3行与缩进(26)



3.2.4变量与对象(27)



3.2.5数字与表达式(29)



3.2.6运算符(31)



3.2.7字符串(31)



3.2.8日期和时间(40)


3.2.9语法糖(42)


3.2.10魔术命令(43)



4数据结构与序列(45)


4.1列表(45)



4.1.1列表索引和切片(46)



4.1.2列表操作(47)



4.1.3内置列表函数(48)



4.1.4列表方法(49)


4.2元组(50)


4.3字典(51)


4.4集合(54)


4.5推导式(56)



5语句与控制流(59)


5.1顺序语句(59)


5.2条件语句(59)


5.3循环语句(61)



5.3.1while循环(61)



5.3.2for循环(62)



5.3.3循环控制(63)



6函数(67)


6.1函数的定义(67)


6.2函数的参数(68)


6.3全局变量与局部变量(70)


6.4匿名函数(71)


6.5递归和闭包(72)


6.6柯里化与反柯里化(74)


6.7常用的内置高阶函数(75)



6.7.1filter函数(75)



6.7.2map函数(75)



6.7.3reduce函数(76)



7迭代器、生成器与装饰器(77)


7.1迭代器(77)


7.2生成器(78)


7.3装饰器(81)



8类(85)


8.1声明类(85)


8.2方法(87)



8.2.1实例方法(87)



8.2.2类方法(89)



8.2.3静态方法(90)


8.3属性(91)



8.3.1实例属性和类属性(92)



8.3.2私有属性和公有属性(92)


8.4继承(94)



8.4.1隐式继承(94)



8.4.2显式覆盖(95)



8.4.3super继承(96)



8.4.4多态(98)



8.4.5多重继承(100)


8.5特性(100)



9多核并行(107)


9.1多进程(109)


92并行(113)



10异常捕获与容错处理(117)


10.1语法错误和异常(117)


10.2异常处理(120)



10.2.1触发异常(120)



10.2.2捕获异常(121)



10.2.3其他处理(122)



11模块和包(125)


11.1模块(125)


11.2包(127)



11.2.1包的组成与调用(127)



11.2.2常用数据分析工具库(128)



12文件I/O(133)



13numpy编程基础(137)


13.1关于numpy(137)


13.2向量(140)


13.3数组(142)



13.3.1数据类型与结构数组(143)



13.3.2索引与切片(145)



13.3.3数组的属性(150)



13.3.4数组排序(151)



13.3.5数组维度(153)



13.3.6数组组合(156)



13.3.7数组分拆(159)



13.3.8ufunc运算(160)


13.4矩阵(166)


13.5文件读写(167)



14pandas编程基础(169)


14.1关于pandas(169)


14.2pandas的数据结构(170)



14.2.1Series(170)



14.2.2DataFrame(174)


14.3pandas的数据操作(185)



14.3.1排序(185)



14.3.2排名(187)



14.3.3运算(189)



14.3.4函数应用与映射(190)



14.3.5分组(192)



14.3.6合并(192)



14.3.7分类数据(195)


14.4时间序列(196)



14.4.1创建时间序列(197)



14.4.2索引与切片(199)



14.4.3范围和偏移量(200)



14.4.4时间移动及运算(203)



14.4.5频率转换及重采样(205)


14.5面板数据与层次化索引(207)



14.5.1创建Panel(208)



14.5.2堆积DataFrame(209)



14.5.3层次化索引(209)


14.6缺失值处理(211)



14.6.1缺失数据的形式(211)



14.6.2缺失数据填充与清洗(213)



14.6.3缺失数据插值(216)



15图形与可视化的编程基础(217)


15.1matplotlib基本绘图(217)



15.1.1函数绘图(217)



15.1.2图形基本设置(224)



15.1.3面向对象绘图(231)



15.1.4绘图样式或风格(233)


15.2pandas基本绘图(234)


15.3基本统计图形(236)



15.3.1折线图(236)



15.3.2面积图(239)



15.3.3直方图(240)



15.3.4条形图(242)



15.3.5龙卷风图(247)


15.3.6饼图(247)



15.3.7阶梯图(249)



15.3.8盒须图(250)



15.3.9小提琴图(253)



15.3.10散点图(254)



15.3.11气泡图(257)



15.3.12六边形箱图(258)



15.3.13雷达坐标图(259)



15.3.14轮廓图(260)



15.3.15调和曲线图(261)



15.3.16等高线图(262)



15.3.17极坐标图(262)



15.3.18词云图(263)



15.3.19数据地图(267)


15.4其他绘图工具(269)


参考文献(271)
















前言/序言

数据科学与大数据技术本科专业的建设实际上是一场教育革命,是受业界需求驱动形成的,其理论基础、课程体系和知识结构框架均处于探索阶段。但有一点非常明确,“实践”是学习该专业最重要、最高效的方式,这也成为本套教材——“普通高等教育数据科学与大数据技术专业‘十三五’规划教材”的编写导向。这不仅需要学生夯实统计学、应用数学以及计算机科学等学科的基础,也需要学生具备大数据所服务行业的相关知识积累和实践经验。只有掌握多学科融会贯通的能力,才能真正成为一个有思想的数据科学家。

为了探索学科人才培养模式,北京大学、中国人民大学、中国科学院大学、中央财经大学和首都经济贸易大学在2014年共同搭建了“大数据分析硕士”培养协同创新平台。在不断的摸索中,一套科学完整的课程体系逐渐建立起来。随后,相关课程也在全国多所院校中实施,成为我国大数据技术高端人才培养体系的蓝本。

为紧跟科学技术的发展潮流,引领中国大数据理论、技术、方法与应用,在北京大数据协会及相关机构的组织下,开展了教材编写的大量前期国内外调研工作,并于2017年6月在云南举办了“第一届全国数据科学与大数据技术本科专业建设研讨会”,展示了调研成果,为中国数据科学与大数据技术人才培养奠定了基础。为进一步厘清该专业的培养方案和课程内容建设的目标和路径,从培养方案、课程体系、培养过程、教材建设等方面深入交流探讨,于2019年5月在北京召开了“第二届全国数据科学与大数据技术本科专业建设研讨会”,会上正式发布了本套系列教材。

本套教材凝聚了全国相关院校数据科学与大数据技术领域著名专家和学者的智慧和力量。在教材编写过程中更加关注的是数据分析思想的引导,体现数据分析的艺术,侧重于从数据和案例出发,厘清数据分析的基本思路,这样能够让读者更好地理解各种假设、公式、定理和模型背后的逻辑。为了结合现实需求,每本教材均配套相关的Python编程代码,让读者在练中学、学中练的过程中夯实基础,积累经验,提升竞争力。尽管编写人员投入了大量的心血,但教材内容还需不断突破和完善,希望能够得到各位专家和同行的批评指正,共同实现此套教材满足教学需求的编写宗旨。

本套系列教材是集体创作的成果。感谢编委会成员和其他编写人员的辛勤付出,以及北京大学出版社和首都经济贸易大学出版社的大力支持。希望此套教材能对广大教师和学生及各数据科学领域的从业人员具有重要的参考价值。


北京大数据协会会长

2019年9月