留出法 拥有的数据集 训练集 测试集 通常将包含m个样本的数据集D={(c1,1),(c2,2),.,(xm,ym)} 拆分成训练集S和测试集T(互斥): 保持数据类别比例! 注意: >保持数据分布一致性,例如:分层采样stratified sampling >多次重复划分(例如:100次随机划分)-单次结果不稳定」 >测试集(比例)不能太大(why?)、不能太小(例如:1/5w1/3)1. &*2)(; /% Ø ')(#5$ : "8,, )( Ø -9 ( : 100-:+)-- ! Ø 07;4 4! ( 1/5~1/3) 63; 07; ()