书籍详情
《SPSS回归分析》[48M]百度网盘|亲测有效|pdf下载
  • SPSS回归分析

  • 出版社:电子工业出版社
  • 出版时间:2015-04
  • 热度:4471
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

编辑推荐

德数据专家申德拉博士力作,炼数成金社区推荐。

内容涉及相关分析,线性、多元回归分析,逻辑和多项逻辑回归,有序回归,非线性回归生存分析(如Kaplan-Meier)等。

从深度、广度两个维度涵盖回归分析领域所需要知道的全部内容。

为图形界面用户和开发人员提供了数百个案例,适用不同版本的SPSS语法。

揭示进行相关分析、回归分析和生存分析时的常见陷阱和规避方案。


内容简介

  回归分析在科学研究领域是最常用的统计方法。《SPSS回归分析》介绍了一些基本的统计方法,例如,相关、回归(线性、多重、非线性)、逻辑(二项、多项)、有序回归和生存分析(寿命表法、Kaplan-Meier法以及Cox回归)。后面的章节介绍了另外一些回归分析方法和模型,例如,个体生长曲线的建模、PLS部分最小平方回归、岭回归、巢式病例对照研究。《SPSS回归分析》对运用SPSS进行回归分析的介绍,目的是让读者对于这方面的基础知识有一个初步了解和掌握,有经验的读者藉此可在数据挖掘(例如,利用Clementine)领域独立地继续学习新知识。

作者简介

   申德拉博士(Dr. 申德拉博士(Dr. Christian FG Schendera), 在数据的采集,处理,分析,可视化和沟通方面有二十多年的经验,曾为多个不同领域的大公司和研究机构提供专业的统计分析和咨询管理服务,已在SPSS,SAS和SQL领域出版了八本关于数据分析和数据质量的德语专著。

目录

第1章 相关
1.1 引言
1.2 第一个前提条件:尺度水平
1.3 其他前提条件:线性、同方差性和连续性
1.4 说明:对线性的图形检验
1.4.1 过程GRAPH,Scatterplot选项
1.4.2 SPSS过程命令CURVEFIT
1.5 相关系数的统计和解释
1.5.1 相关系数的统计量
1.5.2 相关系数的解释
1.6 利用SPSS的计算(示例)
1.7 难点:线性、产生错觉相关和一型差误累积
1.7.1 产生错觉相关和偏相关
1.7.2 一型差误累积问题
1.8 特殊用途
1.8.1 相关系数的比较
1.8.2 比较相关的一致性
1.8.3 正准相关
1.9 计算皮尔逊相关系数的前提条件

第2章 线性回归和非线性回归
2.1 线性回归:有因果方向的关联
2.1.1 双变量线性回归:利用REGRESSION的回归分析概述
2.1.2 双变量线性回归的示例和语句——第一步:根据杠杆值和残差检验线性
并识别离群值
2.1.3 输出结果和解释
2.1.4 过程2:删除离群值的效应——选出的输出结果
2.1.5 说明:绘制回归直线(IGRAPH)的图形
2.2 非线性简单回归
2.2.1 利用线性回归对线性函数进行分析
2.2.2 利用线性回归分析调查非线性函数
2.2.3 将非线性函数线性化,并利用线性回归进行调查
2.2.4 利用非线性回归分析非线性函数:非线性回归
2.2.5 更高的要求:带有两个预测变量的非线性回归
2.2.6 用于非线性回归的SPSS过程NLR和CNLR
2.2.7 非线性回归的假设
2.2.8 总览表:非线性回归的模型
2.3 多元线性回归:多重共线性和其他难点
2.3.1 多元回归的特点
2.3.2 第一个例子:多元回归特殊统计的解释
2.3.3 第二个例子:多重共线性的识别和消除
2.4 计算线性回归的前提条件

第3章 逻辑回归和有序回归
3.1 引言:因变量的因果模型和测量水平
3.2 二元逻辑回归
3.2.1 逻辑回归方法和与其他方法的比较
3.2.2 示例界面和语法:逐步法(BSTEP)
3.2.3 输出结果和解释
3.2.4 示例和语法:直接法ENTER
3.2.5 输出结果和解释
3.2.6 补充说明逻辑回归的理论检验vs诊断:模型拟合优度vs预测效率
3.2.7 二元逻辑回归的前提条件
3.3 有序回归
3.3.1 有序回归方法和与其他方法的比较
3.3.2 例1界面操作和语法:定距预测变量(WITH-选项)
3.3.3 输出结果和解释
3.3.4 例2和语法:分类预测变量(BY选项)
3.3.5 输出结果和解释
3.3.6 有序回归的前提条件
3.4 多项逻辑回归
3.4.1 例子、界面选择和语法:主效应模型(二元因变量)
3.4.2 输出结果和解释
3.4.3 补充说明:逐步计算带有一个二元因变量的模型:
NOMREGREGRESSION和LOGISTICREGRESSION输出结果的比较
3.4.4 特殊情况:带有定量预测变量的巢式病例对照研究(1:1)——示例、
语法、输出结果和解释
3.4.5 补充说明:LOGISTICREGRESSION对比NOMREG(区别)
3.4.6 多项逻辑回归的前提条件
3.5 本章所介绍的各种回归方法的比较

第4章 生存分析
4.1 生存分析概述
4.2 生存分析的基本原理
4.2.1 生存函数S(t)
4.2.2 确定生存函数S(t)
4.2.3 其他函数
4.3 截尾数据
4.3.1 非期望事件或者未发生目标事件
4.3.2 对截尾数据与非截尾数据做不同处理的三个理由
4.3.3 失效数据和截尾的处理(三种方法)
4.4 估计生存时间S(t)的方法
4.4.1 保险精算法和寿命表法
4.4.2 使用Kaplan-Meier法估计生存时间S(t)
4.4.3 无截尾和有截尾的示例(方法:Kaplan-Meier)
4.5 对多个组进行比较的检验
4.6 利用SPSS进行生存分析
4.6.1 示例:无因子Kaplan-Meier法
4.6.2 示例:采用因子的Kaplan-Meier法
4.6.3 利用因子变量与分层变量进行比较(Kaplan-Meier法)
4.6.4 Kaplan-Meier分析的置信区间
4.6.5 不带因子的寿命表计算法示例
4.6.6 带有因子的寿命表法计算示例
4.6.7 计算生存分析的首要条件
4.7 Cox回归
4.7.1 Cox模型简介和背景知识
4.7.2 带有定量协变量的Cox回归
4.7.3 带有二元协变量的Cox回归(k=2)
4.7.4 带有分类协变量的Cox回归(k>2)
4.7.5 针对交互作用的Cox回归
4.7.6 检验Cox回归的前提条件
4.7.7 带有时间相依的定量协变量的Cox回归
4.7.8 Cox回归的特定前提条件
4.7.9 附录:对比方法

第5章 回归分析的其他应用实例
5.1 偏回归
5.1.1 运用PLS过程(PythonExtension)进行计算
5.1.2 运用SPSS过程REGRESSION进行计算
5.2 个体生长曲线
5.2.1 方法1:随机截距模型
5.2.2 方法2:随机斜率模型
5.2.3 方法3:随机截距和随机斜率模型
5.3 岭回归(SPSS宏)
5.3.1 利用岭迹实现多重共线性的可视化
5.3.2 岭回归的计算
5.3.3 SPSS宏“Ridge-Regression”

第6章 其他方法和模型(一览)
6.1 通过SPSS菜单调用其他回归方法
6.2 可用语句调用的其他回归形式
附录A公式
参考文献
您对本书的建议和意见
作者简介

精彩书摘

  《SPSS回归分析》:
  如果要检验在一个因果模型中,是否一个变量会有规律地造成另一个变量的变异,则可以选择回归法代替相关法。对于复杂的模型,可以考虑使用的方法主要是偏相关(第5.3节)或者偏回归,必要时也可以使用路径分析(第5.1节)。
  为了测定两个变量之间关联的程度,统计学发展出了很多测量方法。然而,在各种文献中,对于相关量度(“相关”、“相联”)的专业术语并没有取得统一(参见Lorenz,1992,58ff.)。例如,如果调查几列数值对之间(线性)关联的强度,则人们就将定距型数据或者定序数据(量度数据、极差数据)称为具有相关性。对于交叉列表、2×2表或者列联表则使用相联,或者列联的叫法。对于定序变量,则根据斯皮尔曼相关分析方法将关联强度称为相关。相反,根据肯德尔或萨默斯相关分析方法则称为列联或者相联。Bortz(1993,参见第6.3节)甚至对二元变量采用了相关的说法。选择使用哪种方法,最终取决于变量类别的数量、分布和尺度水平(参见关于列表分析的章节)。在某些情况下,是否存在一个因果模型(例如,“X造成Y”)、关系的原因、变量的数量和其他因素也很重要。但是,所有方法都遵循一个基本原则。从根据经验观察到的关联和理论上的最大关联两个方面对变量进行比较。换而言之,将各个变量当前实际的共同点,与变量之间关系达到完美时变量之间本应具有的共同点进行比较。
  ……

前言/序言

  回归分析及其各种变型在科学和研究领域是最常用的统计方法(例如,参见著作Hsu,2005、P?tschke & Simonson,2003、Elmore & Woehlke,1998,1996和Goodwin & Goodwin,1985)。各个学科领域、科研工作以及统计学的发展既对这些统计方法不断提出更高的要求,同时又起到巨大的推动作用(例如,参见 Rigby 等人 2004年的著作和Ripoll等人1996年的著作)。
  某些作者也将回归分析称为最古老的统计方法之一。Stanton(2001)认为,线性回归基本统计方法的建立起源于Karl Pearson(例如,1896年发表的论文)的论文。Howarth(2001)则认为,线性分析基本理论及其使用方法甚至要追溯到Bond在1636年发表的一篇论文(例如,参见Finney,1996)。
  回归分析发展史上的里程碑,是18世纪中叶人们创建了基本的计算方法后,从而与此相关地发明了“最小二乘”算法。直到20世纪中期发明了计算机之后,多元回归分析方法才被越来越多地应用于海量(并且容易出错)计算,从而加快了回归分析方法的应用、传播和发展。回归分析方法发展史上的其他(任意选出的)里程碑如有20世纪70年代出现的岭回归、80年代兴起的稳健回归以及90年代创建的新方法或对原有方法的混合使用。但是,作为一种表面上传统的方法,如今回归分析在用于数据挖掘时不仅仅是与其他新型方法(如神经网络)处于同一水平(例如,SPSS,2007b,第10章、Rud,2001、Berry & Linoff,2000和Graber,2000),而且比其他方法的使用要频繁得多(例如,Rexer等人2007年的著作和Ayres,2007)。但是,即使是应用数据挖掘的操作十分容易,数据挖掘也不能取代统计学或者计算机信息学知识,而是以这些知识为前提(Schendera,2007、Khabaza,2005、Chapman 等人,1999)。因此,本书针对如何应用SPSS回归分析方法而介绍的基础知识也可以使读者对数据挖掘领域初窥门径。
  统计学的初学者可能对“回归”方法这个大家族的强大、多样化和灵活性感到十分吃惊。对于进阶学习者而言,他们可能始终感兴趣的是如何利用回归分析方法来处理大量的、参差不齐的问题。例如,简单和多重(非)线性回归分析、个体生长曲线、生存分析、时间序列分析等。从另一方面来看,如此广阔的应用范围就面临一个问题,即人们无法单纯依靠背诵就可以掌握:“对于带有一个定距因变量的线性因果模型,人们通常使用线性回归;对于带有一个二元因变量的因果模型,就使用逻辑回归等。”或者:“对于线性回归使用SPSS过程命令 REGRESSION、对于逻辑回归使用SPSS过程命令 LOGISTIC或NOMREG、对于生存数据使用SURVIVAL、KM或COXREG等。”
  与之相反,包括SPSS在内的统计学知识是十分复杂、灵活和多样化的。高级应用者主要将SPSS过程命令 REGRESSION用于线性、共线性数据或者时间序列数据。例如,SPSS过程命令GLM既可以用于在一般线性模型(ALM)中对方差分析的计算,也可以利用多个因变量进行回归分析。例如,相对比较新的SPSS过程命令GENLIN(SPSS 15版之后才有),作为一般线性模型既可以对伽玛回归、采用重复测量设计的二元逻辑回归进行计算,也可以对区间截尾的生存数据的双对数回归进行计算。
  此外,统计量的多样性比SPSS本身的功能范围要大得多。例如,生存数据可以分为一个预期的风险(常规的生存分析、生存分析)、多个预期的互斥风险生存分析(competing risk survival analysis)或者反复性风险(recurrent risk survival analysis)。
  因此,选择适当的回归分析方法不仅取决于可用的SPSS菜单、SPSS过程命令或者“菜谱”,还取决于具体的内容和方法逻辑。例如,需要调查的问题(假设有很多类型,如区别与关联相比照)。但是也取决于需要确定的定义,例如,数据的测量水平、分布、转换、数据关联性/无关联性、主效应和交互效应的建模及很多其他的定义。应与有经验的方法学专家或者统计学专家协商后,再对回归分析方法做出选择。对于特殊的问题,标准软件也有可能无法实现所需的统计方法。在这种情况下,也可以自己用SPSS或者Python编程设计出一种方法(参见宏“Ridge-Regression.sps”),或者使用专门的分析软件。进行模型设定和推断性统计假设检验的操作方法通常越来越复杂(参见Schendera著作,2007,401-403)。
  本书介绍了一些基本的统计方法。例如,相关、回归(线性、多重、非线性)、逻辑(二项、多项)、有序回归和生存分析(寿命表法、Kaplan-Meier法以及Cox回归)。后面的章节介绍了另外一些回归分析方法和模型(例如,个体生长曲线的建模、PLS部分最小平方回归、岭回归、巢式病例对照研究)。
  在这里对SPSS进行回归分析的介绍,目的是让读者对于这方面的基础知识有一个初步了解和掌握,有经验的读者可在此基础上在数据挖掘(例如,利用Clementine)领域独立地继续学习新知识。由于篇幅所限,本书没有介绍很多其他的回归形式和具体应用(例如,非参数回归、分类回归、Weibull回归、 Hedonic回归等,对此请参见本书第6章)。
  本书介绍了相关分析(第1章)、回归分析(线性、多重、非线性,第2章)、逻辑和有序回归分析(第3章)以及生存分析(Survivalanalyse,第4章)的基本方法。对于所有的方法,详细阐述了其前提条件和常犯的错误。第5章介绍了回归分析的特殊用途(偏回归、个体生长曲线的建模、岭回归)。第6章介绍了SPSS的其他用途(例如,对多个因变量的回归分析)。
  书中的大量计算实例系统地演示了所提出的问题、各个统计量的调用方法(通过鼠标、语法)以及对SPSS输出结果的解释。也探讨了各种错误和难点。关于在实施统计分析之前对数据的检验,可参考《SPSS的数据质量》一书(Schendera,2007)。
  书中用单独的段落归纳了实施各个分析的各种前提条件以及对其进行检验的方法。本书浅显易懂,既侧重具体应用,同时对各种方法的解释又没有忽略其复杂性和必要的深度。本书的读者既可以是回归分析的入门者,也可以是经济、生物和社会科学的学生或学者。
  本书既采用了菜单导航,又罗列了大量SPSS语法。Windows SPSS 的初学者应从中了解到,单击鼠标就可以自动调用SPSS语法或者自己编程设计SPSS语法(参见Schendera,2007,2005)。针对SPSS程序员(也包括普通用户),则展示了如何借助SPSS过程命令PLS来扩展SPSS-Python。利用同名的SPSS宏介绍了岭回归。
  第1章介绍了往常被人们低估的相关分析(SPSS过程命令 CORRELATIONS)的入门知识。本章开头部分解释了关联(因果性),并列举了几个错误结论的例子,如人们常说的喜欢玩暴力型电脑游戏和个人暴力倾向之间的关联。如果读者对回归分析感兴趣,则强烈建议先阅读关于相关分析的章节。借助于相关分析,作者阐述了首要的、对于(线性)回归分析也适用的前提条件。例如,尺度水平、同方差性和连续性。接下来的几段阐述了线性、产生错觉相关和一型差误累积几个主题,并且解释了为什么只给定相关系数的数值是远远不够的。本章还介绍了相关分析的其他一些特殊用途,主要是相关系数的比较和正准相关。最后一段归纳了实施相关分析的各种前提条件以及对其进行检验的方法。
  第2章介绍了回归分析的入门知识。本章采用逐步推进的架构,来阐明进行回归分析的基本原则,并且帮助读者从一开始就避免常犯的基本错误。
  第2.1节首先介绍了简单线性回归分析(SPSS过程命令REGRESSION)。第2.1节是基于第1章的内容展开的。通过一个简单的例子,阐述了如何根据杠杆值和残差来检验线性和识别离群值。还阐述了如何检验可能存在的自相关。一般来说,利用线性回归分析只能调查线性函数。利用线性回归分析来调查非线性函数通常会产生错误的结果。
  第2.2节阐述了如果数据不是线性而是曲线分布时应该怎么做。第2.2节是基于第2.1节的内容展开的。本章提供了两种解决方案:将非线性函数进行线性化,并用线性回归进行分析;也可以用非线性回归对非线性函数进行估计(SPSS过程命令CNLR和NLR)。非线性回归是本章的中心主题,包括带有两个预测变量的非线性回归。此外,本节还阐述了用于(非)线性曲线拟合的SPSS过程命令CURVEFIT的意义和限制。最后几段总结了非线性回归的各种假设,并通过一个总览表介绍了较为知名的一些非线性回归模型,其中含有一个或多个预测变量。
  第2.3节介绍了多元线性回归分析(SPSS过程命令REGRESSION)的基础知识。第2.3节是基于第2.2节的内容展开的。模型含有多个自变量,而非仅有一个自变量,这种模型主要是在于自变量相互之间的关系。本节着重探讨了建模、变量选择、多重共线性和其他难点。除了识别和消除多重共线性外,本节还探讨了如何处理时间相依(自回归)数据。最后一段归纳了实施(非)线性回归分析的各种前提条件以及对其进行检验的方法(见第2.4节)。
  第3章介绍了逻辑回归和有序回归的基本方法。本章的结构是根据因变量的尺度水平构建的。最后几段分别归纳了所介绍方法的各种前提条件以及对其进行检验的方法。
  二元逻辑回归(SPSS过程命令LOGISTIC REGRESSION,第3.2节)需要使用一个二值因变量,这个方法中没有考虑因变量中的极差信息。本节首先介绍了作为基本方法的二元逻辑回归,然后阐述了这种方法与其他方法的共同点和区别(主要是模型和尺度水平),并根据几个计算实例,主要阐述变量选择的不同方法,以及对所输出统计量的解释。最后探讨了经常出现的模型拟合优度和预测精度不一致问题。
  有序回归(SPSS过程命令PLUM,第3.3节)需要使用至少两个取值的(定序)因变量,并且考虑到了因变量中的极差信息,同时阐述了与其他方法的共同点和区别(主要是模型、尺度水平)。最后根据几个计算实例,阐述了如何解释模型的SPSS输出结果,其中这些模型带有定距和分类预测变量。
  多项逻辑回归(SPSS过程命令NOMREG,第3.4节)同样需要使用一个至少二级的定类因变量,这种方法没有考虑因变量中的极差信息。对多项逻辑回归的阐述与第3.2节类似。此外,还介绍了一种特殊情况,即带有定量预测变量的巢式病例对照研究(1∶1)。
  第4章介绍了生存分析的基本方法。原则上,生存分析调查的是到出现特定目标事件为止的时间。目标事件既可以是期望事件(例如,延长订单、受聘、学习成功、治愈等),也可以是不良事件(例如,被解雇、故障、旧病复发、死亡等)。这些方法有各种各样的名称,例如,寿命分析、生存分析、时间影响或者事件分析等,它们来自于对目标事件的不同评估。根据对目标事件的评估结果不同,对于图表应给予不同的解释。
  第4.1节首先介绍了生存分析的基本原则,然后介绍了面临的一些典型问题和生存分析的目标。
  第4.2节阐述了对不同生存函数(主要包括累积生存函数S(t)、1减去生存函数(1-S(t))、密度函数f(t)、对数生存函数l(t)以及风险函数h(t))的规定。
  第4.3节介绍了数据截尾的入门知识。在进行生存分析时,在某些个案中,可能出现目标事件没有如期望的那样发生,也就是说,目标事件完全没有或者没有按期望的(设定的)原因而发生。为了将这些个案与带有期望事件的个案隔开,就需要借助于截尾将其标出。本节介绍了左截尾、右截尾和区间截尾,并且诠释了在(非)试验性调查设计时的截尾。
  第4.4节以寿命表法和Kaplan-Meier法为例,阐述了如何用这些方法测算生存函数,以及在这个过程中如何处理截尾的个案。从第4.6节开始介绍SPSS示例。
  第4.5节介绍了对各组进行比较的不同检验:对数极差检验(又称时序检验或者Mantel-Cox检验)、Breslow检验(又称修正的Wilcoxon检验、Wilcoxon 秩和检验)、Tarone-Ware检验和似然比检验。此外,本章还归纳了一个比较性综述,以及对于解释这些检验的建议方案。
  在第4.6节中,计算和解释了如何用SPSS的寿命表法(SPSS过程命令 SURVIVAL)和Kaplan-Meier法(SPSS过程命令KM)。本节还阐述了Cox回归。针对寿命表法提出了带有或者没有因子的几个实例。在对Kaplan-Meier法的阐述中,介绍了带有/没有因子、带有分层变量并且针对测定置信区间的一些实例。
  第4.7节首先介绍了Cox模型的特点(SPSS过程命令COXREG),然后将这种方法与寿命表法、Kaplan-Meier法和线性回归相比较,计算和解释了Cox回归的几种变型(时间独立协变量、时间相依协变量、交互作用和“模式”)。接下来的几段介绍了检验Cox回归特定前提条件(主要是对截尾、多重共线性和比例性假设的分析)的方法以及如何建立对比(“偏差”、“简单”、“Helmert”等)。最后归纳了所介绍方法的各种前提条件,以及对其进行检验的方法。
  第5章借助于SPSS分析示例介绍了回归分析方法的其他用途。
  第5.1节阐述了两种形式的偏回归。第5.1.1节介绍了部分最小平方回归(Partial Least Squares,PLS)。尤其是在有很多预测变量、预测变量相互高度相关,并且(或者)预测变量的数量超过个案的数量时,建议使用PLS。PLS兼具主成分分析和多元回归的特点,从而可以将任意测量水平、任意数量的(潜)变量之间的因果关系模拟成线性的结构化方程模型。此外,PLS还支持混合回归模型和混合分类模型。自变量和因变量既可以是定距的,也可以是定类的。从SPSS 16版开始提供了PLS命令,PLS是基于Python扩展的。第5.1.2节介绍了利用SPSS过程命令REGRESSION进行相关分析的一种偏回归形式。
  第5.2节介绍了如何利用线性混合模型(SPSS过程命令MIXED)对个体生长曲线进行线性建模。个体生长建模(individual growth modeling)大致上也可以改写为“对个体进行重复测量的方差分析”。对于“普通”线性回归而言,只有一条回归线(例如,回归线也会利用轮廓图生成重复测量的方差分析)通常不适合各个不同的个体(线性)运行曲线。但是在进行重复测量的回归分析或者方差分析之前,利用随机截距模型进行建模,就可以根据截距、斜率和两个参数同时估计出个体的运行曲线。借助于一个分为三级的实例分析,下文演示了某个培训项目所有学员的成绩在经过一段时间培训后是否以及在多大程度上有区别。在这个实例中具体检验了:(a)培训学员的(成绩)水平是否波动(截距),(b)培训学员成绩提高的幅度和速度是否不同(斜率),以及(c)在考虑到培训学员成绩水平的情况下,他们成绩的提高幅度是否不同(两个参数)。
  第5.3节介绍了岭回归(SPSS宏“Ridge-Regression.sps”)。岭回归可以(主要是通过目视)检验的是,可能具有多重共线性的数据是否可以用多元线性回归分析来进行分析。与其他统计方法相反,SPSS岭回归没有采用菜单导航,而是只能采用宏的形式。但是,岭回归的实施并不复杂。本节主要演示了多重共线性的可视化,以及如何针对所选择的K值计算岭回归。由于2008年的SPSS 16版没有宏“Ridge-Regression.sps”,因此本节的实例主要基于SPSS 15版的宏。
  第6章用一个总览表介绍了利用SPSS进行回归分析的其他方法(例如,多个因变量的回归分析)。与前面的章节相反,没有对示范性的SPSS分析进行复核。这个总览对完全性不做要求。作为例证,这里归纳了示范性分析的、没有注解的语法示例,主要是因为目前只有通过这种方式才能看到相应的要求。
  为了评估SPSS的输出结果,了解其统计定义和推导过程是必不可少的。在本书的最后一章,归纳了一些最重要的统计方法的公式。
  在开始进行分析之前,请先确定你的数据足以进行分析。检查你的数据是否有潜在的错误(主要是完整性、统一性、缺失值、离群值、重复值)。信任是非常好的,但是检查更加重要。对数据质量的准则和用SPSS验证数据质量这方面知识感兴趣的读者,请参考Schendera(2007)的著作。
  在这里要特别感谢以下各位的专业建议和(或)他们通过语法、数据和(或)资料对本书做出的贡献:Vijay Chatterjee教授(西奈山医学院,纽约,美国)、Mark Galliker教授(伯尔尼大学,瑞士)、Jürgen Janssen教授(汉堡大学)、Mitchel Klein教授(埃默里大学罗琳斯公共卫生学院,亚特兰大,美国)、Roderick J.A. Little教授(密歇根大学,美国)、Daniel McFadden教授(加州大学伯克利分校,美国)、Rainer Schlittgen教授(汉堡大学)、Stephen G. West教授(亚利桑那州立大学,美国)、Matthew M. Zack(疾病控制中心,佐治亚州亚特兰大,美国)。
  还要感谢德国SPSS软件慕尼黑有限责任公司的Alexander Bohnenstengel先生、Sabine Wolfrum女士和Ingrid Abold女士慷慨地提供了这套软件和相关的技术资料。同样,也要感谢SPSS瑞士分公司的Josef Schmid先生和Daniel Schloeth博士。
  感谢奥登伯格出版社Schechler博士对发表本书的信任以及对此提供的大力支持。Peter Bonata先生(科隆)为Cox回归一章奠定了基础。Volker Stehle先生(埃平根)负责本书的印刷排版工作。Stephan Lindow先生(汉堡)为本书制图。Markus Schreiner先生(海德堡)为特殊分布提供了随机数据。如果本书中还有阐述不清楚或者错误的地方,欢迎各位读者不吝赐教。
  Dr. ChristianFG Schendera(克里斯蒂安·FG·申德拉博士)
  瑞士,伯尔尼