正在加载图片...
X轴的沿Y轴的距离就是我们所说的残差。残差图可以让我们更直观地看清所有 数据在最佳拟合直线两侧分布的情况。 Scatter plot with Line of Best Fit Residual plot spenp +2 Line of best fit pezip.epu 0 0 Residual Residual Variable X Variable Y 为什么要使用残差图来评估模型呢?因为我们想评估模型的准确性,即度量 预测值和实际值之间的差距。对于所有的数据,每一个数据点都会产生一个残差, 我们就可以分析所有残差集合的中位值在哪里,上四分之一位置在哪里,下四分 之一位置在哪里,最小值最大值分别是多少。我们使用损失函数来度量准确性, 在损失函数中我们可以直接拿残差进行分析,但是由于残差有正有负,所以我们 也可以使用残差的绝对值,也就是绝对误差来进行分析,也可以对残差取平方来 进行分析,后两种方式都是在避免正残差和负残差之间互相抵消导致评估不准确 的情况。 如何去解读残差图呢?我们可以看到Y轴就是残差,X轴就是拟合值的预测 变量。如果对于某两个因素构成的残差图,所有的点基本上都均匀、随机地分布 在X轴的上下两侧,那我们就认为这两个因素之间确实存在着线性关系,所以用 线性模型就比较合适。但是如果我们发现这些散点在X轴两侧的分布并不均匀, 也不随机,呈现明显的偏差,比如所有的点都在上方;或者都在下方;或者在上 方的点远远多于在下方点;或者在上方的所有的这些点都远离X轴,而在下方的 点靠近X轴都比较近。这时我们就说这两个因素之间存在的关系并非是线性关X 轴的沿 Y 轴的距离就是我们所说的残差。残差图可以让我们更直观地看清所有 数据在最佳拟合直线两侧分布的情况。 为什么要使用残差图来评估模型呢?因为我们想评估模型的准确性,即度量 预测值和实际值之间的差距。对于所有的数据,每一个数据点都会产生一个残差, 我们就可以分析所有残差集合的中位值在哪里,上四分之一位置在哪里,下四分 之一位置在哪里,最小值最大值分别是多少。我们使用损失函数来度量准确性, 在损失函数中我们可以直接拿残差进行分析,但是由于残差有正有负,所以我们 也可以使用残差的绝对值,也就是绝对误差来进行分析,也可以对残差取平方来 进行分析,后两种方式都是在避免正残差和负残差之间互相抵消导致评估不准确 的情况。 如何去解读残差图呢?我们可以看到 Y 轴就是残差,X 轴就是拟合值的预测 变量。如果对于某两个因素构成的残差图,所有的点基本上都均匀、随机地分布 在 X 轴的上下两侧,那我们就认为这两个因素之间确实存在着线性关系,所以用 线性模型就比较合适。但是如果我们发现这些散点在 X 轴两侧的分布并不均匀, 也不随机,呈现明显的偏差,比如所有的点都在上方;或者都在下方;或者在上 方的点远远多于在下方点;或者在上方的所有的这些点都远离 X 轴,而在下方的 点靠近 X 轴都比较近。这时我们就说这两个因素之间存在的关系并非是线性关
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有