2020/2/14 ●●●思考题3 从统计应用来看这次失败的案例 ·分客透售没示种芬用色摆含适?什么时候不合适 统计失败原因之一:应用场录选择婚误 这个项目的失是由于问题的复来性, 在成镜羊功能 一种在 合适的例子:标的物西定,技术标准是否达标; 。在不情物不的资花分有的意又是什么: t先有差 。分布的存在性,结构性,密度性,差异性 成绩对个体的正面作用被忽略了。 ·建立分有边界,有效利用分布特点进行差异化分析 统计的能与不能之争 对需求的变化从套用、移花接木式的统计应用向对统计设 数据分析如此复杂,有哪些 基本的要领 前提供的信息是不相匹配的。 型 中的建 ●··三种参数的认识 非参数统计的作业要求 陈述间题State the problen 设的 ,(信号》统计参数 并思怎样的 合你手中的数据Re 将这营方法的代 数统计的方 heaeeentouarconpaienpaiethco 防止算法崩渍)计算参数 用非参数方法提出一种解决方案紫Propose a soluion using 122020/2/14 2 思考题3 分布适合作为一种标准吗?什么时候合适?什么时候不合适 ?合适的情况下,分布的作用是什么? ⚫ 分布是用来刻画不确定性的,不确定的由来:一方面是 由测量误差所引起的,惟极贫无依,则械系不稍宽,为 标准以警其余。——清·方苞《狱中杂记》,而另一反 方面是由可见数据集的有限性所引起的,标准不能用来 刻画后者的不确定性。 ⚫ 合适的例子:标的物固定,技术标准是否达标; ⚫ 不合适的例子:标的物不固定。 在评标物分布不固定的时候,研究分布的意义是什么? ⚫ 分布的存在性,结构性,密度性,差异性 ⚫ 建立分布边界,有效利用分布特点进行差异化分析 从统计应用来看这次失败的案例 统计失败原因之一:应用场景选择错误 这个项目的失败是由于问题的复杂性,在成绩单功能 的认识上,它主要的功能还是用来反映学生学习状态, 知识掌握程度的工具,若硬要将成绩单开发成一种在人 才市场上精英人才快速甄别的专业占领市场策略,则还 有大量的灰色地带有待开发,后来者居上的成功人士都 经历过先有差成绩单而后奋起搏发的励志经历,教育不 应陷入“成绩绑架”论。在危机面前策略简单化的驱动 下,成绩对个体的正面激励作用被忽略了。 数据分析如此复杂,有哪些 基本的要领 ---数据分析有过程 ---一步一步向上建 统计的能与不能之争 对统计需求的变化从套用、移花接木式的统计应用向对统计设计 的需求 Good of fit 检验:用于检查目前的数据是否和给定的一种正常的 情况是吻合的, 如果差距较大,表示那种正常的假设是与数据目 前提供的信息是不相匹配的。 Lack of fit 检验:以数据为中心,检验当前的模型是否合适,如 果不合适,提供哪些信息量来辅助建模 模型 模型1 模型2 模型3 模型5 模型4 模型为中心的建模 数据为中心的建模 三种参数的认识 (为了算法正常运行)环境技术参数:脚手架是为了保证分 析过程顺利进行而搭设的工作平台参数,例如为算法停止而 设置的参数,这些参数是程序依赖的,不是数据依赖的; (信号)统计参数: ⚫ 代表数据中稳定的信息部分,这些信息可以告诉我们应该选择 怎样的模型来提取数据的模型尝试中的lack of fit检验统计量和 结果,这些检验结果帮助我们尝试不同的模型空间信息; ⚫ ; (防止算法崩溃)计算参数: ⚫ 在提取模型的时候,需要在模型空间上进行参数的估计,然而 模型的系数在全局优化的目标下会变形,在模型空间中为防止 选择错误的模型而辅助性的设置的参数,也是经常调参的参数 所指。 非参数统计的作业要求 陈述问题State the problem 描述数据Describe the data 翻阅并思考怎样的统计方法适合你手中的数据Review what statistical methods are available to analyze your data 将这些方法的优点和缺点列出来,特别是将非参数统计的方法 和参数方法做一些比较List their advantages and disadvantages, in particular compare nonparametric to parameteric methods 用非参数方法提出一种解决方案Propose a solution using nonparametric methods 列出你将要完成的分析任务(收集数据,编程,模拟数据,估 计和检验)List all the tasks that you plan to do: collecting data, programming, simulating data, estimating, testing, etc. 7 8 9 10 11 12