深度|用户节电的大数据分析及应用
科技进步导致了大量数据的产生,大数据分析在各行各业应用广泛 #生活知识# #科技生活# #科技影响分析#
摘要
为解决用户在开展节电工作时面临的用电数据不透明、缺少节电指导依据等问题,提出大数据背景下基于数据挖掘的用户节电通用分析方法,并在大数据平台上予以并行化实现,设计了直观的可视化展示形式。首先依据用户用电特性通过高维聚类实现了用电群体细分,然后融合电力、气象、经济等多维度数据开展节电分析,基于用户能效综合评估确定群体内节电标杆并量化用户节电潜力,接着通过多源数据关联分析获得用户节电策略,最后,通过SparkR在大数据平台上实现了节电算法业务的并行化,基于JavaWeb MVC框架实现了分析结果的可视化展示。实际应用效果表明,所提出的节电大数据分析方法,能有效关联多源数据,实现对海量用户数据的高效分析。
关键词 :大数据;节电分析;分布式存储;并行化计算;数据可视化;
(来源:电网技术作者:陈海文1, 王守相1, 梁栋2, 苏运3)
1.智能电网教育部重点实验室(天津大学),天津市 南开区 300072
2.电工装备可靠性与智能化国家重点实验室(河北工业大学),天津市 北辰区300401
3.国网上海市电力公司,上海市 浦东新区 200122
0 引言
用户侧节电是近年来我国节电工作的开展重点[1],而电力用户作为节电业务的实施主体,开展节电工作的积极性不高,究其原因,用户在用电时具有很强的盲目性,用电数据不透明,用户缺少获知自身耗电水平及用电特点的信息渠道,难以发现用电过程中存在的问题,节电工作开展缺乏指导性建议,而如果由节能公司进行侵入式的节电评估则时间长、价格高。
由于数据来源及数据规模限制,现阶段还未有通用的用户节电分析流程方法,已有研究工作主要针对特定行业的个别用户[2],尚缺乏从用户用电群体角度开展的节电分析研究。如文献[1]针对能效电厂项目,从节电量和移峰填谷2个方面计算了节电潜力。文献[3]分析了北欧建筑照明设备的构成,估算了通过更新照明设备带来的节电潜力。但这些针对具体行业或者设备的建模分析方法并不具有通用性。文献[4-5]从省级区域的角度分析了中国能源短缺情况及各省份的节电潜力,对具体用户缺少指导作用。建立适用于各行业用户的具有通用性的节电分析方法,并针对具体用户给出节电指导建议是当前研究的难点。由于即便在同一行业,用户用电规模、用电行为差异化明显,找到海量用户之间的群体性规律是节电分析重点。
此外,对标是督促指导用户节电有效手段,目前节电标杆往往由国家标准或者同行业先进水平来确定,尚缺少对节电标杆选取的相关研究。在目前我国社会经济持续发展及产业结构不断调整的背景下,用户的用电特性越发多样化,同一行业的不同用户用电特性差异巨大,难以确立在整个行业范围内具有代表性及典型性的节电标杆。由相关管理部门确定的国家标准或者行业先进水平则由于新技术、新设备的不断发展而导致时效性较差。因此需要在群体细分基础上,提出一种考虑多因素的用户能效综合评估方法以确定节电标杆。
随着大数据产业的不断发展和智能电网建设的不断推进,供电公司对生产数据、营销数据、社会经济数据、地理信息数据的积累日益增加[6-7],形成了以数据种类多,规模大,异构特征突出,关联复杂为特点的配用电大数据[8-11]。在大数据背景下的用户节电分析,对数据管理、数据处理、数据分析、数据可视化等关键技术提出了更高的要求,给节电分析平台开发带来很大挑战[12]。文献[8]在实验室环境下搭建了用于负荷预测的Hadoop平台,并设计了一种并行化的随机森林算法用于负荷预测。文献[9]建立了用于供电安全性分析的大数据平台。文献[10]搭建了电力设备的运行状态监测的大数据平台,提高了数据读写效率,并利用联机分析处理技术对电力设备的运行状态进行监测。
用户节电分析涉及气象、社会等诸多因素,具有极强的关联性;在算法方面,涉及到高维聚类,多因素关联等多种算法,对计算速度提出了较高要求;由于节电分析平台服务对象是电力用户,对结果展示的准确性、直观性要求更高。传统的平台开发工具,架构设计,交互方式及展示形式无法满足大数据下节电分析的客观需求。针对以上问题,本文提出了基于数据挖掘的用户侧节电分析方法,包括用电特性高维聚类、综合能效评估、考虑多因素的节电策略构建等步骤,并在大数据分析平台上实现了相关算法业务的并行化,大大提高了分析效率。分析结果通过Web发布,易于用户访问,网页利用HTML5、Javascript组件实现了图表的动态交互,便于用户从多维度直观了解自身用电情况,有针对性地开展节电工作。
1 用户节电分析流程
1.1 用户节电分析路线
首先,通过用电特性高维聚类,得到典型用电模式及用电群体,在每个群体内通过综合能效评估选择标杆用户作为节电基准,计算得出群体内各用户的节电潜力,进而通过对用户节电潜力以及其他关联因素的挖掘,利用偏最小二乘回归算法,计算气候、社会等多因素的节电灵敏度系数,并分析用户用电行为,结合已有的节电策略库,通过决策树算法提供个性化、有针对性的节电策略。算法流程如图1所示。
1.2.1 基于分布式两阶段聚类的用电模式分析
以K-means为代表的聚类算法在负荷分类、用电模式发现中得到了广泛应用[13-15]。由于实际上普遍存在的用电数据的缺失会严重影响聚类的准确性,为此,本文采用传统距离标准与向量统计特征进行加权调和的思想,来克服数据缺失对聚类准确性的影响,从而能在一定程度上降低对数据清洗的要求[16]。以K-means算法为例,将距离度量改进为
为了适应大规模数据集处理,提出一种分布式两阶段聚类算法:首先利用基于统计距离的K-means算法对用户进行聚类分析,得到其用电模式;然后将得到的单用户典型日用电曲线作为原始曲线再次进行层次聚类[16],通过层次聚类控制用电模式的数量,从而得到用户群体的典型用电模式。并行化实现方式可见第2节。
抽取1000个用户进行用电模式分析,重复进行3次实验,结果如表1所示,对比聚类融合算法与直接聚类算法,两阶段聚类稳定性提高了47%,类内轮廓系数指标提高了27%,表明两阶段聚类融合算法能提高聚类的稳定性及准确性。以物业管理用户为例,获得典型的用电模式如附录图A1所示。
1.2.2 基于t-SNE及子空间聚类的用电群体细分方法
网址:深度|用户节电的大数据分析及应用 https://www.yuejiaxmz.com/news/view/374816
相关内容
数据分析常被应用于哪些领域?数据分析最常应用的4大场景探析大数据在生活中的相关应用
数据分析在生活中的新应用
实时数据分析:实时数据流与实时应用场景
日用品电商销售数据分析
【大数据分析对现代生活的作用】
【时间序列管理秘籍】:xts数据包基础及深度解析
微生活数据分析有什么用
9种最常用数据分析方法!
数学在生活中的数据应用实例分析怎么写