62经验模型 基于数据分析的建模方法 问题 *在建立数学模型的过程中经常需要建立变量 之间的关系 *由于对研究对象的内部机理不甚了解不能通 过合理的假设或根据物理定律、原理,经过机 理分析法而得到 解决思路 借助于由实验或测量得到的一批离散数据
6.2 经 验 模 型 一.基于数据分析的建模方法 * 在建立数学模型的过程中,经常需要建立变量 之间的关系. *由于对研究对象的内部机理不甚了解,不能通 过合理的假设,或根据物理定律、原理, 经过机 理分析法而得到. 问题 解决思路 * 借助于由实验或测量得到的一批离散数据
通过对数据充分观察和分析获得数据所含信息; 揭示变量间的内在联系; 并选择适当的数学式对变量间的关系进行拟合 J
*并选择适当的数学式对变量间的关系进行拟合. *通过对数据充分观察和分析, 获得数据所含信息; *揭示变量间的内在联系; o x y
类确定性关系确定的函数关系 变量关系 相关关系存在相依关系,但未达到相 互确定的程度 已知规律函数的测试数据(在特定时 两间点或距离上的数据) 类 数 据呈现随机性的数据可看成具有某种概 率分布的随机样本值
两 类 变 量 关 系 确定性关系 确定的函数关系 相关关系 存在相依关系,但未达到相 互确定的程度. 两 类 数 据 已知规律(函数)的测试数据(在特定时 间点或距离上的数据) 呈现随机性的数据,可看成具有某种概 率分布的随机样本值
针对两种不同类型的数据,有不同的建立 模型方法: 1.数据拟合法(适用于第一类数据) 基本思想已知函数y=f(x)的一组测试数据 (xy;),〔i=1,2 寻求一个函数v(x),使vx对上述测试数据 的误差较小,即v(x)y;,于是可以用vx)来 近似替代f(x) 常用的数据拟合方法:一般插值法、最小二 乘法、样条函数光顺法等
针对两种不同类型的数据, 有不同的建立 模型方法: 1. 数据拟合法(适用于第一类数据) 基本思想 已知函数 y= f(x) 的一组测试数据 (xi ,yi ), (i=1,2,…,n), 寻求一个函数ψ(x),使ψ(x)对上述测试数据 的误差较小,即ψ(xi )≈yi,于是可以用ψ(x)来 近似替代f (x). 常用的数据拟合方法:一般插值法、最小二 乘法、样条函数光顺法等
插值法的基本思想寻找fx)的近似替代函数 (x),在插值节点x上满足 qp(x;)=y;,( 9···9 其余点用q(x近似替代敢x),称@(x)为f(x)的 插值函数 Vi f(r) x
插值法的基本思想 寻找 f(x)的近似替代函数 φ(x), 在插值节点xi 上满足 φ(xi )=yi, (i=1,2,…,n), 其余点用φ(x)近似替代f(x ), 称φ(x)为f(x)的 插值函数. f ( x) x i x i y
最小二乘法基本思想寻找f(x)的近似替代函数 q(x),使 mn ∑(f(x;)-9(x;) i=1 2.随机分析方法 对于随机数据进行拟合可用统计学中的回归 分析方法或时间序列分析方法 二.经验模型的建立 以上两种建模方法都是建立在对数据进行充分 分析的基础上
最小二乘法基本思想寻找 f (x)的近似替代函数 φ(x), 使 = − n i xi xi f 1 2 min . ( ( ) ( )) 2. 随机分析方法 对于随机数据进行拟合,可用统计学中的回归 分析方法或时间序列分析方法. 二.经验模型的建立 以上两种建模方法都是建立在对数据进行充分 分析的基础上
寻找或选择适当的函数拟合变量之间的关系 (函数关系或回归关系是重要的环节 1)绘制数据散布图 般2)分析数据散布图 见呐 步 骤3)选择函数关系形式 通过分析数据散布图可以获得对变量间关系 的感性认识,形成初步的看法,以便于对问题 做进一步的分析 2)分析数据散布图 对数据散布图进行分析可以分析出变量的 关系是:
寻找或选择适当的函数拟合变量之间的关系 (函数关系或回归关系)是重要的环节. 一 般 步 骤 1)绘制数据散布图; 2)分析数据散布图; 3)选择函数关系形式. 通过分析数据散布图可以获得对变量间关系 的感性认识, 形成初步的看法, 以便于对问题 做进一步的分析. 见 p156 2)分析数据散布图; 对数据散布图进行分析,可以分析出变量的 关系是:
1)线性的还是非线性的? 2)有无周期性? 3)呈现何种变化趋势?变化率如何? ,等等有用的初步结论 例621建立一个简洁的函数关系式来描述 某个地区人的身高和体重的对应关系数据见表 7.4(pl56) 曲线特征是体重w随身高H的增长而单调增 长,但可以观察到是非线性增长 练习试分析以下问题
1)线性的还是非线性的? 2)有无周期性? 3)呈现何种变化趋势?变化率如何? …,等等有用的初步结论. 例6.2.1 建立一个简洁的函数关系式来描述 某个地区人的身高和体重的对应关系, 数据见表 7.4(p156). 曲线特征是体重W 随身高H 的增长而单调增 长,但可以观察到是非线性增长. 练习 试分析以下问题
1.氮施肥量N、磷施肥量P关于土豆产量的数 据散布图(P153例71.1) 2.海浪潮高度x随时间t的数据散布图 3)选择函数关系形式 原1形式尽可能简洁,尽可能线性化; 则2.依据实际问题的精度要求合乎实际规律 续例6.2.1选择幂函数W=cH,描述身 高体重关系 优点此函数可以线性化 两边取对数,有
1. 氮施肥量N、磷施肥量P 关于土豆产量的数 据散布图(P153例7.1.1). 2. 海浪潮高度x 随时间t 的数据散布图. 3)选择函数关系形式 原 1. 形式尽可能简洁, 尽可能线性化; 则 2. 依据实际问题的精度要求,合乎实际规律. 续例6.2.1 选择幂函数 W= , 描述身 高体重关系. a cH 优点 此函数可以线性化. 两边取对数, 有
Inw=alnhtln c 令y=hnW,x=lH,b=lnc 变换为线性函数y=ax+b. 例622可选二次函数 y=b0+ bjx+b2x 描述氮肥施肥量与土豆产量间的变量关系 注:其中b=y(0)=1518. 关于磷肥施肥量和土豆产量的变量关系可选择 威布尔模型 y=A- Be 9≥0
lnW = aln H + lnc 令 y = lnW, x = ln H,b = lnc 例6.2.2 可选二次函数 注:其中 b0= y(0) = 15.18. 关于磷肥施肥量和土豆产量的变量关系可选择 威布尔模型: = − , 0 − y A Be x Kx 变换为线性函数 y = ax + b. 描述氮肥施肥量与土豆产量间的变量关系. 2 y = b0 + b1 x + b2 x