书籍详情
《数据分析概论》[41M]百度网盘|亲测有效|pdf下载
  • 数据分析概论

  • 出版社:格致出版社京东自营店
  • 出版时间:2019-08
  • 热度:4686
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

编辑推荐

适读人群 :高校社会学、经济学师生。

《数据分析概论》一书介绍了社会科学研究中蕞常见和蕞常用的内容——数据。数据是解释某个现象或某件事的要素,但如何运用数据、如何分析数据,这是很多社会学学生以及刚从事社会科学研究的人所面临的一大问题。《数据分析概论》一书就满足了广大研究者和学生的需要。该书不仅提供了有关数据搜集的介绍,也一一探讨了分析数据的统计工具,全面而深入。作者利用大量数学公式和图表来讨论数据分析,并以一个基于大学生学业能力的分析的例子来丰富读者的认识。

内容简介

《数据分析概论》研究对象是社会科学的研究数据。数据分析可以赋予事实意义,好的数据分析能为所研究的社会现象提供合理的描述和解释。

本书旨在为定量研究数据分析的每一步提供统计学基础。作者讨论了数据搜集的意义、一元统计、对相关性的测量、显著性检验、简单和多元回归,并给出了大量的数学公式,使得读者能更好地理解这些内容。


作者简介

迈克尔·S.刘易斯-贝克

美国艾奥瓦大学政治科学教授,担任Sage出版公司社会科学定量方法应用(QASS)系列丛书主编。出版和发表了大量著作,包括《回归应用导论》《社会科学家的新工具:研究方法的发展及其应用》等。


目录

第1章 导论

第2章 数据搜集

第1节 研究问题

第2节 样本

第3节 测量

第4节 数据编码、输入和检查

第3章 一元统计

第1节 集中趋势

第2节 离散

第3节 集中趋势、离散和异常值

第4章 相关测量

第1节 相关

第2节 定序数据:tau相关测量

第3节 名义数据:Goodman-Kruskal lambda系数

第4节 二分变量:灵活选择

第5节 小结

第5章 显著性检验

第1节 显著性检验的逻辑:一个简单的例子

第2节 运用同一逻辑:二元相关测度

第3节 几个重要问题

第4节 小结

第6章 简单回归

第1节 Y是关于X的方程

第2节 最小二乘法法则

第3节 截距和斜率

第4节 预测和拟合优度

第5节 显著性检验和置信区间

第6节 报告回归结果

第7章 多元回归

第1节 例子

第2节 统计控制

第3节 模型设定错误

第4节 虚拟变量

第5节 共线性

第6节 交互效应

第7节 非线性

第8节 归纳和结论

第8章 建议


附录

参考文献

译名对照表


精彩书摘

不同变量的值应当被有效的储存,以备电脑分析。对于某些变量来说,所记录的值的含义显而易见,因为它由直接搜集的数值构成。举个例子,学术能力(AA)这个变量的值显然是入学考试时0-100的分值。父母教育(PE)变量也类似,上学年限也是输入的数字。但对于其他变量,其编码值(value code,用来指代变量值的符号)的含义并不那么明显。

我们来看“学生动机”变量,其值包括“愿意”、“不愿意”、和“无法确定”。在表2.1的列SM中,数字2指代那些回答“愿意”的学生,数字1指代那些回答“无法确定”的学生,数字0指代那些回答“不愿意”的学生。这些数字只是编码,它们指代学生回答的类别。显然,我们可以用其他数字来指代某个特定的回答,而不会改变该回答的内在含义。譬如,如果我们用“3”来替代“学生动机”变量中的编码“2”,并不表示更高的动机水平;而仅仅是用另一个数字来识别那些回答“愿意”的学生。对于数据中其他变量(性别、宗教、社区类型和导师评价),我们同样看到变量值都是数字编码,但仅仅把这些数字看作位置标记符(placeholder)。

社会科学研究中对每个个案的观测,包括变量标签(labels)和编码,一般来说都是输入到电脑中并储存在一个数据文件中。表2.1确实看起来很像是一个典型的来自个人电脑的数据文件。我们应当经常仔细核查可能存在的编码错误(coding error),即是否变量值的输入有误?令人欣喜的是,对表2.1中数字的核查表明不存在失控编码(wild code),即不存在超出变量可能取值范围的变量值(如没有人的“学术能力”分数是“103”,或“学生动机”值是“8”)。但更为细微的错误,如回答类别的记录错误则可能发生。例如,一个学生可能在“学生动机”变量上回答“愿意”(编码=2),但却被错误记录为“不愿意”(编码=0)。为了避免此类错误,研究团队的每位成员都应核查编码过程,从而获得较高的交互编码信度(intercoder reliability)。我们确信数据中即使存在编码错误,数量也极少。最后,虽然一些受访者在某些调查项目上存在缺失数据(missing data),但在表2.1所含变量上并不存在缺失数据。或许颇令人惊讶,但宗教变量R上没有缺失数据,样本中的每位学生都选择了三个选项中的一项。这表明我们对问卷的先期规划较好,对回答类别的设定也比较合适,从而有效减少了拒答情况。如果不是这种情况,那么我们就面临明显的缺失数据问题,而接下来几章中所运用的分析技术也会无用武之地。


前言/序言

《韦伯斯特大学辞典》(Webster’s New Collegiate Dictionary)把“数据”定义为“一组事实”。因此社会科学数据(经验观察)是关于人类行为世界的事实。与流行的看法相反,事实并不会自己说话。数据分析的任务是试图给这些事实赋予意义。我之所以说“试图”赋予意义是因为如果数据不好,它们就不能产生阐释,或者是一个虚假的阐释。假设数据很好,那么分析就能为所研究的社会现象提供一个合理的描述和解释。

数据分析涉及对统计工具的系统运用。我们如何能够获得这些工具并恰当的使用它们?为了有效学习分析技巧,我们需要从最简单的部分开始,以之作为构建更复杂技巧的基石。譬如,初学者经常犯的一个错误就是跳过基础知识,直接进入多元回归分析。为了学好多元回归,你必须首先扎实的掌握一元和二元统计知识。通过学习例如两个变量间的相关系数(皮尔森r系数),你就能熟悉相关、强度、线性、测量层次、推论和标准化等概念。这给理解二元回归提供了基础,二元回归有点难,但不是很难。一旦熟悉掌握了二元回归,扩展到多元回归就比较容易,读者对后者也会有更深的理解。

本书旨在为定量研究数据分析的每一步提供统计学基础。在简述数据搜集之后,作者讨论一元统计(测量集中趋势和离散)。之后又讲解了对相关的测量(皮尔森r、tau和lambda系数)和显著性检验,最后讨论了简单和多元回归。本书给出了必要的数学公式,但更注重平实的解释。同时,作者也利用图表来帮助阐释。贯穿全书的一个实用例子是基于一个大学生样本数据来探讨如何解释学业能力。

回到本丛书的标题“社会科学定量方法应用”,本书可以看作是其他著作的一本入门书。本丛书的其他著作都对本书讨论的主题进行了深入探讨。譬如,关于数据搜集可参阅Kalton的Introduction to Survey Sampling (No. 35), Jacob的Using Published Data (No. 42), Kiecolt & Nathan的Secondary Analysis of Survey Data (No. 53), Converse & Presser的Survey Questions (No. 63),以及Bourque & Clark的Processing Data (No. 85);关于一元统计可参阅Weisberg的Central Tendency and Variability (No. 83)和Gibbons的Nonparametric Statistics (No. 90);有关二元统计可参阅Reynolds的Analysis of Nominal Data (No. 7),Hildebrand, Laing, & Rosenthal的Analysis of Ordinal Data (No. 8),Liebetrau的Measures of Association (No. 32)和Gibbons的Nonparametic Measures of Association (No. 91);关于显著性检验可参阅Henkel的Tests of Significance (No. 4)和Mohr的Understanding Significance Testing (No. 73);关于回归可参阅Lewis-Beck的Applied Regression (No. 22),Berry & Feldman的Multiple Regression in Practice (No. 50),Jaccard, Turrisi, & Wan的Interaction Effects in Multiple Regression (No. 72),Fox的Regression Diagnostics (No. 79),Berry的Understanding Regression Assumptions (No. 92)和Hardy的Regression With Dummy Variables (No. 93)。