正在加载图片...
第4期 王德文,等:一种基于内存计算的电力用户聚类分析方法 ·573. 2.2实验数据 峰电量为当日用电高峰期所用电量,例如 1)原始测量数据 7:00~12:00,19:00:~00:00,谷电量为当日用电低 本实验原始数据来源于居民用电的实际测量数 谷期所用电量,例如00:00~7:00。平电量为当日用 据,数据的采集频率为1min,每户数据约200万条, 电不是高峰期和用电低谷期用的电量。图7给出实 采集内容包括用户标识、采集日期、采集时间、有功 验数据集所构成的某户一周内用电量曲线。 功率、电压、电流、智能插座1用电量、智能插座2用 表2实验数据集 电量、智能插座3用电量等,如表1所示。 Table 2 Experimental data sets 表1居民用电测量数据 字段属性 描述 Table 1 Measurement data of electric power consumption 用户标识 用户唯一标识 字段属性 描述 采集日期 格式为20121217 用户标识 用户唯一标识 用电量/kW·h 每日用电量 采集日期 格式为2012/12/17 峰电量/kW·h 每日峰电量 采集时间 格式为20:27 谷电量/kW·h 每日谷电量 有功功率/kW 平均每分钟有功功率 平电量/kW·h 每日平电量 电压/N 电压 常住人口/人 家庭居住人口数 电流/A 平均每分钟电流 居住面积/m2 住房实际使用面积单位 冰箱、空调、洗衣机、微波炉 智能插座/W·h 等家用大功率电器的用电量 35 ◆ 图6给出原始测量数据中某天有功功率曲线 30 实例。 s25 ◆一总电量士一谷电量 8 量一峰电量一一平电量 7 6 品 5 4 3 3/253/263/273/283/293/303/31 日期 图7一周内用电量曲线图 Fig.7 Electric power consumption graphs in a week 时间 在下面的实验过程中,将从实验数据集中随机 图6某天测量数据实例 选取具有高耗能、中等耗能、低耗能典型特征的用户 Fig.6 Example of measurement data in a day 用电数据进行实验测试,进行多次的测试,取平均值 2)数据预处理与实验数据集构建 为最终实验结果。实验数据集虽然没有达到大数据 原始测量数据无法直接用于实验分析,需要对 的规模,但可以用此实验数据进行算法正确性实验, 其进行预处理,按照实验目的构建实验数据集。 并对实验数据集扩充进行内存并行化性能测试。 原始测量数据中的电压、电流在实验中无需使 2.3实验结果分析 用,需要进行删除。原始测量数据中存在约1.3%的 1)实验1结果分析 空缺值,需要对其进行删除,并增加常驻人口与居住 本实验采用SCK对采集到的海量智能用电数 面积等数据。原始数据采集频率为1min,实验所需 据进行聚类分析,其聚类结果的准确率达到了 的数据无须精确到分钟,将每天的数据进行合并,计 90.7%,其中9.3%的用户聚类错误的原因为用户在 算统计出每天用电量、峰电量、谷电量与平电量等, 某一天或者某一时刻改变了用电规律,造成采集的 并进行单位转换。新构建的实验数据集包括用户标 用电数据发生较大的波动,但也不排除用电数据在 识、采集日期、每日用电量、峰电量、谷电量、平电量、 采集过程中或者传输过程中发生错误。其聚类结果 常住人口与居住面积等,如表2所示。 如表3所示。由表3中的数据计算可得使用SCK2.2 实验数据 1)原始测量数据 本实验原始数据来源于居民用电的实际测量数 据,数据的采集频率为 1 min,每户数据约 200 万条, 采集内容包括用户标识、采集日期、采集时间、有功 功率、电压、电流、智能插座 1 用电量、智能插座 2 用 电量、智能插座 3 用电量等,如表 1 所示。 表 1 居民用电测量数据 Table 1 Measurement data of electric power consumption 字段属性 描述 用户标识 用户唯一标识 采集日期 格式为 2012 / 12 / 17 采集时间 格式为 20:27 有功功率/ kW 平均每分钟有功功率 电压/ V 电压 电流/ A 平均每分钟电流 智能插座/ W∙h 冰箱、空调、洗衣机、微波炉 等家用大功率电器的用电量 图 6 给出原始测量数据中某天有功功率曲线 实例。 图 6 某天测量数据实例 Fig.6 Example of measurement data in a day 2)数据预处理与实验数据集构建 原始测量数据无法直接用于实验分析,需要对 其进行预处理,按照实验目的构建实验数据集。 原始测量数据中的电压、电流在实验中无需使 用,需要进行删除。 原始测量数据中存在约 1.3%的 空缺值,需要对其进行删除,并增加常驻人口与居住 面积等数据。 原始数据采集频率为 1 min,实验所需 的数据无须精确到分钟,将每天的数据进行合并,计 算统计出每天用电量、峰电量、谷电量与平电量等, 并进行单位转换。 新构建的实验数据集包括用户标 识、采集日期、每日用电量、峰电量、谷电量、平电量、 常住人口与居住面积等,如表 2 所示。 峰电量 为 当 日 用 电 高 峰 期 所 用 电 量, 例 如 7:00~12:00,19:00:~ 00:00,谷电量为当日用电低 谷期所用电量,例如 00:00~7:00。 平电量为当日用 电不是高峰期和用电低谷期用的电量。 图 7 给出实 验数据集所构成的某户一周内用电量曲线。 表 2 实验数据集 Table 2 Experimental data sets 字段属性 描述 用户标识 用户唯一标识 采集日期 格式为 20121217 用电量/ kW∙h 每日用电量 峰电量/ kW∙h 每日峰电量 谷电量/ kW∙h 每日谷电量 平电量/ kW∙h 每日平电量 常住人口/ 人 家庭居住人口数 居住面积/ m 2 住房实际使用面积单位 图 7 一周内用电量曲线图 Fig.7 Electric power consumption graphs in a week 在下面的实验过程中,将从实验数据集中随机 选取具有高耗能、中等耗能、低耗能典型特征的用户 用电数据进行实验测试,进行多次的测试,取平均值 为最终实验结果。 实验数据集虽然没有达到大数据 的规模,但可以用此实验数据进行算法正确性实验, 并对实验数据集扩充进行内存并行化性能测试。 2.3 实验结果分析 1)实验 1 结果分析 本实验采用 SCK 对采集到的海量智能用电数 据进行 聚 类 分 析, 其 聚 类 结 果 的 准 确 率 达 到 了 90.7%,其中 9.3%的用户聚类错误的原因为用户在 某一天或者某一时刻改变了用电规律,造成采集的 用电数据发生较大的波动,但也不排除用电数据在 采集过程中或者传输过程中发生错误。 其聚类结果 如表 3 所示。 由表 3 中的数据计算可得使用 SCK 第 4 期 王德文,等:一种基于内存计算的电力用户聚类分析方法 ·573·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有