调整气象观察站问题评讲 某地区内有12个气象观察站(位置如图),有 10年各观察站的年降水量数据为了节雀开支 想要适当减少气象站 问题:减少哪些观察站可以使得到的降水量 的信息量仍然足够大? 如何利用熵的概念解决此问题,给出解决问 题的思路。 一.问题分析 首先找出问题中的关键词进行联想.∠
调整气象观察站问题评讲 某地区内有12个气象观察站(位置如图),有 10年各观察站的年降水量数据.为了节省开支, 想要适当减少气象站. 问题:减少哪些观察站可以使得到的降水量 的信息量仍然足够大? 如何利用熵的概念解决此问题,给出解决问 题的思路。 一 . 问题分析 首先找出问题中的关键词,进行联想
减少站数 保持信息量 删除各站 原则关系 足够大衡量 指标 降水 衡量熵 数据 指标 降水数据
减少 站数 删除 原则 保持 信息量 各站 关系 降水 数据 足够大 衡量 指标 衡量 指标 熵 降水数据
二问题的分解 初态:12个气象站的年降水数据。 (无日或月的咚水数据,也无地理、气候等其 它条件) 解决问题的 惟一出发点 目标态:减少气象站数,并保持降水量足够大的 信息量 过程:(将做的事情) (1)信息量的衡量(用熵); (2)给出删除气象站的条件及原则; (3)建立保持足够信息量的判别条件;
二. 问题的分解 初态:12个气象站的年降水数据。 (无日或月的降水数据,也无地理、气候等其 它条件.) 目标态:减少气象站数,并保持降水量足够大的 信息量. 过程:(将做的事情) (1) 信息量的衡量(用熵); (2) 给出删除气象站的条件及原则; (3) 建立保持足够信息量的判别条件; 解决问题的 惟一出发点
三解决问题的思路 (1)确定各气象站的年降水量:随机变量 (X1,X2,…,X12) 的概率分布,并计算各个气象站降水量的熵值 (2)分析判断各站年降水量(两两之间或多个变 量间)是否存在相关关系线性的或非线性的),并 据此保留其中熵值较大的气象站 统计检验 另一种方法:用聚类分析法进行聚类 可由降水数据分析各个气象站的相似性,如 同为干旱、湿润地区等) 仍保留降水量的信息量较大的站
(1) 确定各气象站的年降水量: 的概率分布,并计算各个气象站降水量的熵值. (2) 分析判断各站年降水量(两两之间或多个变 量间)是否存在相关关系(线性的或非线性的),并 据此保留其中熵值较大的气象站. 随机变量 另一种方法:用聚类分析法进行聚类. 三.解决问题的思路 (可由降水数据分析各个气象站的相似性,如 同为干旱、湿润地区等.) 统计检验 仍保留降水量的信息量较大的站
(3)建立保持足够信息量的判别条件 可考虑各种判别条件,如 1)设定一个阈值,保留所有熵值大于值的气 象站 2)使保留气象站的信息量总和占原信息量总和 的一定比例 注:阈值或比例值均需背景知识和经验来确定
1) 设定一个阈值,保留所有熵值大于阈值的气 象站; 2) 使保留气象站的信息量总和占原信息量总和 的一定比例. 可考虑各种判别条件,如: (3) 建立保持足够信息量的判别条件 注:阈值或比例值均需背景知识和经验来确定