云计算平台的研究及应用是目前的热点问题。面向智慧园区的云计算平台与公有云有着显著区别,出于安全考虑,将其设计成私有云模式,同时在受控访问的前提下允许私有云访问和利用公有云的资源。文章设计了面向智慧园区的云计算平台,同时指出了其相应的应用方向,云计算在节能减排、决策支持等方面均可提供有效服务,对智慧园区云计算平台建设及研究具有重要的参考意义。

0、引言

自IBM于2008年提出“智慧地球”之后,智慧城市的浪潮席卷全球。园区作为城市经济文化建设不可分割的一部分,也面临着向信息化、智慧化转型的迫切需求。工信部2014年批准了中关村软件园等9家园区为全国首批智慧软件园区试点单位;上海于2014年推出了首批12家智慧园区试点单位,涵盖临港产业区、康桥产业区、松江经济技术开发区、浦东软件园、漕河泾新兴技术开发区、市北高新技术服务业园区等。

近年兴起的云计算技术由于具有计算能力强、资源动态分配等特点,越来越受到智能园区建设者的关注。云计算在能源调控、资产管理、决策支持等方面均可发挥重大作用,可以为智慧园区的高效运行和可持续发展提供保障。

智慧园区云计算平台是一个庞大复杂的系统工程,涉及的技术众多,本文从智能园区需求的角度给出了面向智慧园区的云计算平台设计方案,目前国内外尚无类似研究。首先分析了云计算技术的基本情况及特点,进而提出了智慧园区云计算平台的架构,并以国网客服中心南北园区为例分析了可能的应用场景,最后讨论了智慧园区云平台未来面临的挑战。

1、智慧园区云计算平台的实现 1.1云计算概述

云计算是一种利用互联网实现随时随地、按需、便捷地访问共享资源池的计算模式。计算机资源服务化是云计算的重要表型形式,使得用户不必关心数据中心的管理、在线存储等细节问题。使用云计算技术,用户可以按需申请和释放计算或存储资源,资源的利用率和服务水平都得到了提高。与传统计算模式对比,云计算的特点包括整合异构网络资源、虚拟化与服务、以互联网作为通信平台、可伸缩性强、具有规模经济效益等。传统的分布式计算往往只能整合网络同构性很强的计算资源,对于不同网络、不同操作系统中的计算资源很难发挥作用,而云计算能够将大范围内的、属于不同网络的计算资源加以组织,另外,云计算可以屏蔽计算设备软硬件差异,从而将众多计算设备纳入计算平台;虚拟化技术让用户在面对云计算时感觉面对的并非是众多计算资源的集合,而是一个单一的实体;云计算平台以拥有成熟体系、标准的互联网作为通信平台;当计算能力不足时,云计算能够快速集成扩展计算能力,且平台升级迅速;按需付费的模式让计算服务同水电服务一样灵活、方便,成为日常工作和学习的必需品,从而产生庞大的经济效益。

云计算常常与网格计算相混淆。从技术发展的角度上来讲,云计算是网格计算等传统分布式计算的发展,但网格计算与云计算的最显著差异在于网格计算主要关注基础设施的整合,而云计算则将系统平台与软件应用同时抽象成服务并提供给用户。

1.2智慧园区云计算平台架构

广义上来说,云计算平台就是云控中心与计算平台相互独立的同时而又互相协作的实体。云控中心依据用户发送来的请求,为各个计算节点动态分配用户任务,参与任务的计算节点将各自任务完成后的结果集中到控制中心,控制中心最后汇总结果给用户。对于云存取请求,云控中心将用户数据通过互联网分布式存储在云端或者从云端读取。在虚拟化技术的支撑下,云计算及云存储服务对用户而言都是透明的。类似于通信系统中的时分复用,每个用户看起来链路上的设备是自己独享的,云计算用户眼中的云服务也是独享的。同时,云计算平台应为用户提供多种终端接入方式,如智能手机、平板电脑、个人电脑等。云计算组成见图1。

平台大量传感器及数据采集终端为云计算处理及决策提供原始的数据信息,包括温度、湿度等天气信息。对于传感器不能获取的信息,可能需要借助遥感卫星。就云计算平台的服务对象和建设地点而言,智慧园区云计算平台属于私有云的范畴。智慧园区云计算平台系统架构见图2。

由于服务范围小,智慧园区云平台采用将云控中心和计算资源整合成云数据中心的方案,按照云计算平台的层次划分原则,数据中心属于基础设施即服务(InfrastructureasaService,IaaS)层。为了保证智慧园区云计算平台的安全性和私有性,在智慧园区云数据中心与公有云之间设立防火墙。当私有云存储容量和计算能力难以满足需求时,云数据中心可以向公有云以租赁的形式获取存储和计算能力。在此过程中,访问控制和数据安全是需要关注的重点。平台即服务(PlatformasaService,PaaS)层提供数据处理模型,数据处理模型位于云计算模型的中间层,有着承上启下的作用。软件即服务(SoftwareasaService,SaaS)层主要为智能园区各部门工作人员提供多种应用服务。

1.3智慧园区云计算平台关键技术 1.3.1虚拟化技术

虚拟化技术属于一个抽象出来的层次,其将底层的基础设施与操作系统分离,在动态分配计算和存储资源的基础上最大化共享物理设施。在虚拟化技术中,CPU、内存、硬盘、网卡等硬件都被抽象为标准化组件,用户可以根据需要安装自己的操作系统及软件,或者由虚拟化软件默认安装一个操作系统,组件和操作系统等传统计算机系统运行所必须的一切软硬环境都被封装在虚拟机文件中,方便复制、保存。总体来说,虚拟化技术特点可以总结为:软件实现、隔离运行、封装抽象、硬件独立、广泛兼容、标准接口。

1.3.2虚拟机在线迁移技术

虚拟机在线迁移是指在虚拟机不掉电的情况下,将运行中的虚拟机从一台服务器转移到另一台服务器,该技术对于云计算平台的有效运行意义重大。

1)实现了负载均衡。当一台物理服务器负载过重时,可以通过迁移技术将该服务器的部分负载迁移到另一台服务器当中,实现负载均衡,优化云平台整体服务性能。

2)保证了平台可靠性。当某台物理服务器发生异常时可以启用备份虚拟机。另一方面,当平台需要维护部分服务器而又不中断服务时,可以选择将待维护服务器中的虚拟机迁移出去。

3)节能环保。将负载率低的服务器上的虚拟机迁移集中,实现部分服务器空闲,从而将这些服务器关机,节约电能。

1.3.3数据处理模型

平台即服务层要求对上和对下均能提供海量数据的处理能力。MapReduce是谷歌公司采用的并行处理模型,在谷歌的文件系统上运行。分布GREP、分布排序、Web连接图反转、每台机器的词矢量、Web访问日志分析、反向索引构建、文档聚类、机器学习、基于统计的机器翻译等谷歌应用程序都采用了MapReduce这一处理模型。开源分布式系统Hadoop也采用了MapReduce做为其计算框架。MapReduce处理数据的过程可以分为Map阶段和Reduce阶段。一个完整的MapReduce作业的过程为:Map阶段载入数据,并行处理后将处理结果以键值对的形式保存在本地节点;Reduce阶段读取Map阶段产生的中间结果,按用户预先设定的条件合并输出结果。对于整个处理过程中的预处理、容错方式、负载均衡等问题,MapReduce都提供了预置的解决方案,用户要做的就是根据自己的需要重载Map方法和Reduce方法。在处理能力遇到瓶颈时,可以采用增加计算节点的方式提升处理速度。

2、智慧园区云平台应用展望及挑战 2.1智慧园区云平台应用展望

国网客服中心南北园区是国家电网公司“三个中心”的重要组成部分。云计算平台在国网客服中心南北园区中的可能应用包括以下方面。

2.1.1数据预测

考虑到系统中光伏发电以及冷、热、电、热水等多种负荷的不确定性,在制定优化调度策略前需要对相应的数据进行合理预测。预测过程通常可以概括为历史数据分析、建模和确定预测结果3个部分。预测时首先要重视原始数据的收集与分析,特别是剔除其中的异常数据或伪数据,这些数据是由历史上的突发事件或某些特殊原因对统计数据带来重大影响而产生的。异常数据的存在会给正常的建模产生较大的干扰,从而影响预测体系的预测精度,因此必须采取措施排除异常数据带来的不良影响,主要的方法有修正法、样本剔除、解析分析法、相关法等。

历史数据分析是指对海量历史数据按照一定的统计指标进行统计计算和评价。特别地,对于时间序列数据,通常会从惯性、周期性、随机性等方面进行考察。通过自相关性分析,可以得知这几种典型特性的大致情况。通过与假设相关的指标进行互相关性分析,能够验证2个指标是否互相影响。面对海量的历史数据,传统的基于内存的算法很难满足分析需求,而MapReduce在处理海量数据方面优势明显,尤其是异常数据的排除,同时,通过基于MapReduce编程框架设计出的预测模型能够大幅度提高预测的效率。

2.1.2决策支持

智能园区的决策支持模型涉及能耗统计、故障管理、成本控制、安全布放等方面。以智慧园区分类别设备的电能消耗情况决策分析为例,对于异常耗能的设备群体不能按常规的统计与查询来解决,正常工作日上班时间的能量消耗相对比较正常,是有效的消耗;工作日下班时间及周末时间的耗能相对应较低,不应出现异常高能耗的情况,但有可能在异常使用状态下,如下班或周末不关闭电源、用电设备以及异常用电(电磁炉等高能耗用电设备)等情况,这种消耗大部分是无效的。因此可以采用基于云平台的聚类分析方法进行多方面的聚

类分析,这样基于综合特征的能耗细分比单个特征的细分更有意义。因此考虑多方面特征进行聚类,这样基于综合特征的能耗细分比单个特征的细分更有意义。

2.1.3办公娱乐

利用云平台虚拟化技术、云存储技术等为园区工作人员提供基于云平台的在线办公及海量的的影音娱乐服务,并提供多种终端接入接口,例如电脑、平板、智能手机等。同时接入接口应提供不同操作系统的版本,例如基于Windows与基于Mac的接入接口。这样做的优势在于提高了资源的利用率,并降低了对带宽的要求。以在线影音为例,多人同时上网在线观看高清电影对园区平台的接入带宽是极大的挑战,而基于云平台的解决方案是将热门电影缓存在云平台存储空间上,当用户需要观看影片时,首先检索云平台的影音库,从而实现不访问公网的情况下观看影片,这是以空间换带宽的典型应用。

2.2智慧园区云平台面临的挑战 2.2.1安全问题

安全问题是云计算的首要问题,包括虚拟机之间的有效隔离、访问控制等方面。一旦云数据中心遭到攻击,将会对整个园区的数据安全造成巨大破坏。另外,除了来自园区外部的攻击,安全问题也有可能出现在内部,如违规操作、蓄意泄密等,如何保证系统内部安全也是安全问题需要关注的重点之一。

2.2.2可靠性问题

尽管虚拟机在线迁移、在线备份等技术使云平台本身具有很强的可靠性,但还远远不够。云平台上的数据高度集中,因此有必要继续研究加强云平台可靠性的方案。

3、结语

本文在讨论了云计算平台总体架构的基础上,设计了面向智慧园区的云计算平台,在安全优先的前提下将平台设计成私有云,与互联网上的公有云之间访问受控,同时分析了涉及的部分关键技术,讨论了在南北园区可能涉及的应用场景,最后分析了智慧园区云平台面临的挑战,对智能园区云计算算平台的建设及研究有重要的参考意义。

作者简介

张春光,国网信息通信产业集团北京国电通网络技术有限公司,硕士,主要从事电力信息通信方向研究。

李树泉,国家电网公司客户服务中心,硕士,高级工程师,主要从事电力工程、能源互联、低碳节能等方面的研究。

蔡永涛,华北电力大学,硕士,主要从事数据挖掘方面的研究。

吴文炤,国网信息通信产业集团北京国电通网络技术有限公司,本科,高级工程师,主要从事电力信息通信方向研究。

引言信息

张春光,李树泉,蔡永涛,等.面向智慧园区的云计算平台设计[J].供用电,2015,32(12):21-25.

原文链接: http://psd.bjx.com.cn/html/20151208/689325.shtml