正在加载图片...
数据挖掘问题的数学表述 我们用下面三个部分来描述从样本学习的一般模型(图1.1): (1)产生器(G),产生随机向量x∈R,它们 是从固定但未知的概率分布函数F(x)中独立抽 取的, (2)训练器(S),对每个输入向量x返回 一个输出值y,产生输出的根据是同样固定但未 知的条件分布函数DF(ylx)。 1.1 根据样本学习的一个模型。在学习 (3)学习机器(LM),它能够实现一定的函 过程中,学习机器LM观察数据对 (x,y)(训练集),在训练之后,学习 数集f(x,a),a∈A,其中A是参数集合②。 机器必须对任意输人x给出输出 学习的问题就是从给定的函数集f(x,a), y,学习的目标是能够给出输出y, α∈A中选择出能够最好地逼近训练器响应的函 使之接近训练器的响应y 数。这种选择是基于讽练集的,训练集由根据联 合分布F(x,y)=F(x)F(yx)抽取出的(个独立同分布(i.i.d.)观測 (x1,y1),…,(,y (1-1) 组成。 99 数据挖掘问题的数学表述
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有