正在加载图片...
数据分析方法详述 谭权2013201112 Wilcoxon秩和检验 秩:设X为一总体,将一容量为的样本观察之按自小到大的次序编号排列成为 X(1)<X(2)<…<X(n) X(们的下标称为X()的秩。秩和就是一个样本中数据秩的总和。 该检验方法主要检验两个样本的总体的均值是否相同。原假设H0:比较两组的总体分 布均值相同 计算方法:首先建立假设,然后将两组数据混合排序,绵秩。将样本数最小的组的秩和 作为检验统计量T,接着以样本书含量叫小组的个体数nl,样本书之差n2-n1及T值查验 界值表 得出p值。做出统计结论。 文章中,作者运用实验1的数据得到了在standard和buy模式下人们对于独裁者行为 的社会合适度评价。由于是相同的被试者分别作出的评价,因此我们分配结果相同的情况下, 人们对于两种模式下行为评价数据的分布是相同的,仅仅是均值不同。运用计量软件得出结 当p值越小时,我们越能拒绝原假设,即认为两个样本的均值存在显著差异。这就是 说 人们对于不同模式下,造成相同分配结果的评价不同(口值小于0.05可以认为不同 Logistic regression Ordered logistic regression 当因变量是两分类变量,自变量是连续变量或者分类变量时,通过logistic回归可以分 析自变量对于因变量的影响程度。将因变量的两种分类分别设为Y=0和Y=1,logi1stic回归 是一种概率估 利 即自变量对于P(Y=1) 程度。 这和线性概率模型(PM)有 相似点,不同之处在于logistic回归采用的方程形式不同,P(Y=1)=e^ (1+enx), 表示影响因素或者影响因素的一个函数,logistic回归采用极大似然法估计相关系数。LPM 采用的是线性函数形式,采用最小二乘法估计相关系数。PM缺点在于进行估计后进行计 算时,概率值会不再0,1]区间内,且对于某些分析,比如患病概率和年龄的关系。两者之间 不是线性关系1。 sc回归可以使年龄越大,志病率的增加越快,更符合实际情况,同 时概率值一直位于0,1]内。 Ordered logistic regression和普通的logistic regression不同点就在于ordered logistic regression的因变量是多分类变量,而logistic regression的因变量是两分类变量。 在研究是否位于buy模式下对独裁者分配钱数的影响是,由于独裁者可以选择的行动 一共有11种,结果也有11种,是多分类变量,采用的是ordered logistic reg ression.而分 析是否位于buly模式下平均分配和独占时,结果只有两种,是或者不是,采用的就是logistic regression。 非参数卡方检验 卡方检验是指诵讨样本数据,推断样太来自的总体分布是否与期望分布或某一理论分布 存在显著性差异的吻合性检验。原假设为:样本来自的总体分布与期望分布或某一理论分布 无差异 作者发现捐款额度在1-4美元的人数比例在两种模式下存在差异,但并不了解这种差 异是否显著,那么以其中一种模式下的数据为期望分布,看另一种模式下的分布是否和期望 3 3 数据分析方法详述 谭权 2013201112 Wilcoxon 秩和检验 秩:设 X 为一总体,将一容量为 n 的样本观察之按自小到大的次序编号排列成为 X(1)<X(2)<…<X(n) X(i)的下标 i 称为 X(i)的秩。秩和就是一个样本中数据秩的总和。 该检验方法主要检验两个样本的总体的均值是否相同。原假设 H0:比较两组的总体分 布均值相同 计算方法:首先建立假设,然后将两组数据混合排序,编秩。将样本数最小的组的秩和 作为检验统计量 T,接着以样本书含量叫小组的个体数 n1,样本书之差 n2-n1 及 T 值查验 界值表,得出 p 值,做出统计结论。 文章中,作者运用实验 1 的数据得到了在 standard 和 bully 模式下人们对于独裁者行为 的社会合适度评价。由于是相同的被试者分别作出的评价,因此我们分配结果相同的情况下, 人们对于两种模式下行为评价数据的分布是相同的,仅仅是均值不同。运用计量软件得出结 果,当 p 值越小时,我们越能拒绝原假设,即认为两个样本的均值存在显著差异。这就是 说,人们对于不同模式下,造成相同分配结果的评价不同(p 值小于 0.05 可以认为不同) Logistic regression 和 Ordered logistic regression 当因变量是两分类变量,自变量是连续变量或者分类变量时,通过 logistic 回归可以分 析自变量对于因变量的影响程度。将因变量的两种分类分别设为 Y=0 和 Y=1,logistic 回归 是一种概率估计模型,即自变量对于 P(Y=1)的影响程度。这和线性概率模型(LPM)有 相似点,不同之处在于 logistic 回归采用的方程形式不同,P(Y=1)=e^x/(1+e^x),x 表示影响因素或者影响因素的一个函数,logistic 回归采用极大似然法估计相关系数。LPM 采用的是线性函数形式,采用最小二乘法估计相关系数。LPM 缺点在于进行估计后进行计 算时,概率值会不再[0,1]区间内,且对于某些分析,比如患病概率和年龄的关系,两者之间 并不是线性关系,logistic 回归可以使年龄越大,患病率的增加越快,更符合实际情况,同 时概率值一直位于[0,1]内。 Ordered logistic regression 和普通的 logistic regression 不同点就在于 ordered logistic regression 的因变量是多分类变量,而 logistic regression 的因变量是两分类变量。 在研究是否位于 bully 模式下对独裁者分配钱数的影响是,由于独裁者可以选择的行动 一共有 11 种,结果也有 11 种,是多分类变量,采用的是 ordered logistic regression,而分 析是否位于 bully 模式下平均分配和独占时,结果只有两种,是或者不是,采用的就是 logistic regression。 非参数卡方检验 卡方检验是指通过样本数据,推断样本来自的总体分布是否与期望分布或某一理论分布 存在显著性差异的吻合性检验。原假设为:样本来自的总体分布与期望分布或某一理论分布 无差异 作者发现捐款额度在 1-4 美元的人数比例在两种模式下存在差异,但并不了解这种差 异是否显著,那么以其中一种模式下的数据为期望分布,看另一种模式下的分布是否和期望
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有