正在加载图片...
XⅫ 关于本书 第13章扩展了第8章中介绍的回归方法,分析非正态分布的数据。这一章首先介绍了广义线 性模型,然后重点介绍了如何预测类别型变量(Logistic回归)或计数变量(泊松回归)。 多元数据分析的一个难点是简化数据。第14章介绍了如何将大量的相关变量转换成较少的不 相关变量(主成分分析),以及如何发现一系列变量中的潜在结构(因子分析)。这些方法涉及许 多步骤,每一步都有详细的介绍。 实际工作中面临的一一个普遍问题是数据值缺失,第15章介绍了一一个应对此问题的现代方法。 中有很多简捷的方法可以用来分析因各种原因导致缺失而生成的不完整数据。这一章对一些好 的方法都有介绍,还具体说明了在什么情况下应该用哪一种以及应该避免使用哪些方法。 第16章介绍了R中最先进、最有用的数据可视化方法,包括用lattice图形表现非常复杂的数据, 简要介绍新的g9P1ot2包,并对各种跟图形实时交互的方法做了综述。 后记中介绍了一些优秀的网站,有助于读者进一步学习R、加入R社区、获得帮助,并及时 获得R这个快速发展的软件的最新信息。 最后的内容也很重要,8个附录(从A到H)扩展了正文的一些内容,包括R中的图形用户界 面、自定义和升级R、导出数据到其他软件、创建出版级质量的输出、(像MATLAB一样)用R做 矩阵计算,以及处理大型数据集。 例子 为了让本书内容尽可能接近各个领域的实际情况,我从心理学、社会学、医学、生物、商业 和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。 这些例子中所使用的数据集是经过精心挑选的,因为它们不仅提出了有趣的问题,而且比 较小。这样能让读者专注于技术,快速地理解所涉及的过程。在学习新方法时,数据集小是有好 处的。 这些数据集有些是基本安装中就有的,有些则可以通过网上下载软件包来获得。每个例子 的代码都可以从www.manning.com/RinAction下载。为了更好地理解本书中的内容,我建议读者 在阅读本书时试试这些例子。 经常听人引用这么一一句话:如果你问两个统计学家该如何分析一个数据集,你会得到三个答 案。反过来说,每个答案都能让你更好地理解数据集。对于一个问题,我不会说某种分析方式是 最好的,或者是唯一的。读者应该用本书中学到的技术动手分析数据,看看都能得到什么。R是 交互式的,最好的学习方法就是自己尝试。 排版约定 下面是本书的排版约定。 口等宽字体用于代码清单。 ①也可在图灵社区(www..ituring..com.cn)本书网页免费注册下载。一编者注 图灵社区会员matrixvirus(matrixvirus@163.com))专享尊重版权XII 关于本书 第13章扩展了第8章中介绍的回归方法,分析非正态分布的数据。这一章首先介绍了广义线 性模型,然后重点介绍了如何预测类别型变量(Logistic回归)或计数变量(泊松回归)。 多元数据分析的一个难点是简化数据。第14章介绍了如何将大量的相关变量转换成较少的不 相关变量(主成分分析),以及如何发现一系列变量中的潜在结构(因子分析)。这些方法涉及许 多步骤,每一步都有详细的介绍。 实际工作中面临的一个普遍问题是数据值缺失,第15章介绍了一个应对此问题的现代方法。 R中有很多简捷的方法可以用来分析因各种原因导致缺失而生成的不完整数据。这一章对一些好 的方法都有介绍,还具体说明了在什么情况下应该用哪一种以及应该避免使用哪些方法。 第16章介绍了R中最先进、最有用的数据可视化方法,包括用lattice图形表现非常复杂的数据, 简要介绍新的ggplot2包,并对各种跟图形实时交互的方法做了综述。 后记中介绍了一些优秀的网站,有助于读者进一步学习R、加入R社区、获得帮助,并及时 获得R这个快速发展的软件的最新信息。 最后的内容也很重要,8个附录(从A到H)扩展了正文的一些内容,包括R中的图形用户界 面、自定义和升级R、导出数据到其他软件、创建出版级质量的输出、(像MATLAB一样)用R做 矩阵计算,以及处理大型数据集。 例子 为了让本书内容尽可能接近各个领域的实际情况,我从心理学、社会学、医学、生物、商业 和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。 这些例子中所使用的数据集是经过精心挑选的,因为它们不仅提出了有趣的问题,而且比 较小。这样能让读者专注于技术,快速地理解所涉及的过程。在学习新方法时,数据集小是有好 处的。 这些数据集有些是R基本安装中就有的,有些则可以通过网上下载软件包来获得。每个例子 的代码都可以从www.manning.com/RinAction①下载。为了更好地理解本书中的内容,我建议读者 在阅读本书时试试这些例子。 经常听人引用这么一句话:如果你问两个统计学家该如何分析一个数据集,你会得到三个答 案。反过来说,每个答案都能让你更好地理解数据集。对于一个问题,我不会说某种分析方式是 最好的,或者是唯一的。读者应该用本书中学到的技术动手分析数据,看看都能得到什么。R是 交互式的,最好的学习方法就是自己尝试。 排版约定 下面是本书的排版约定。  等宽字体用于代码清单。 —————————— ① 也可在图灵社区(www.ituring.com.cn)本书网页免费注册下载。——编者注 图灵社区会员 matrixvirus(matrixvirus@163.com) 专享 尊重版权
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有