開關電源廠家口若懸河講面向智能電網(wǎng)應用的電力大數(shù)據(jù)關鍵技術
大數(shù)據(jù)這個術語最早期的引用可追溯到Apache軟件基金會的開源項目Nutch。當時,大數(shù)據(jù)用來描述為更新網(wǎng)絡搜索索引需要同時進行批量處理或分析的大量數(shù)據(jù)集。
早在2008 年Nature就出版了?癇ig Data”,從網(wǎng)絡經(jīng)濟學、超級計算、互聯(lián)網(wǎng)技術、生物醫(yī)藥、環(huán)境科學等多個方面介紹了海量數(shù)據(jù)帶來的挑戰(zhàn);2011年Science推出數(shù)據(jù)處理的?癉ealing With Data”,深入討論了數(shù)據(jù)洪流(datadeluge,DD)所帶來的挑戰(zhàn),并指出如果能夠更有效地組織和利用這些海量數(shù)據(jù),人們將得到更多的機會發(fā)揮科學技術對推動社會發(fā)展的巨大作用;2012年奧巴馬宣布美國政府投資2億美元啟動“大數(shù)據(jù)研究和發(fā)展計劃”,將大數(shù)據(jù)比喻為“未來的新石油”,將對大數(shù)據(jù)的研究上升為國家意志,掀起了世界各國大數(shù)據(jù)的研究熱潮。
大數(shù)據(jù)的定義,業(yè)界雖然有一些共識,但是并未有統(tǒng)一的定義。麥肯錫認為“大數(shù)據(jù)是指其大小超出典型數(shù)據(jù)軟件抓取、儲存、管理和分析范圍的數(shù)據(jù)集合”;Gartner認為“大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)”。
在對大數(shù)據(jù)的定義中,比較有代表性的定義是3V定義,即規(guī)模性(Volume),多樣性(Variety)和高速性(Velocity),規(guī)模性是指數(shù)據(jù)量龐大,數(shù)據(jù)洪流已經(jīng)從GB、TB級上升到PB、EB、ZB級;多樣性是指數(shù)據(jù)類型繁多,并且包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù);高速性則是指數(shù)據(jù)以數(shù)據(jù)流的形態(tài)快速、動態(tài)的產(chǎn)生,數(shù)據(jù)處理的速度也必須達到高速實時處理。
另外大數(shù)據(jù)第4V的討論并沒有取得一致的結(jié)論,國際數(shù)據(jù)公司(international data corporation, IDC)認為大數(shù)據(jù)應該具有價值性(Value),且價值密度稀疏;IBM則認為大數(shù)據(jù)的第4V特性是真實性(Veracity)。大數(shù)據(jù)的這些特點決定了在大數(shù)據(jù)時代,傳統(tǒng)的數(shù)據(jù)處理技術必需有革命性的提升。
電力系統(tǒng)作為經(jīng)濟發(fā)展和人類生活依賴的能量供給系統(tǒng),也具有大數(shù)據(jù)的典型特征。電力系統(tǒng)是最復雜的人造系統(tǒng)之一,其具有地理位置分布廣泛、發(fā)電用電實時平衡、傳輸能量數(shù)量龐大、電能傳輸光速可達、通訊調(diào)度高度可靠、實時運行從不停止、重大故障瞬間擴大等特點,這些特點決定了電力系統(tǒng)運行時產(chǎn)生的數(shù)據(jù)數(shù)量龐大、增長快速、類型豐富,完全符合大數(shù)據(jù)的所有特征,是典型的大數(shù)據(jù)。
在智能電網(wǎng)深入推進的形勢下,電力系統(tǒng)的數(shù)字化、信息化、智能化不斷發(fā)展,帶來了更多的數(shù)據(jù)源,例如智能電表從數(shù)以億計的家庭和企業(yè)終端帶來的數(shù)據(jù),電力設備狀態(tài)監(jiān)測系統(tǒng)從數(shù)以萬計的發(fā)電機、變壓器、開關設備、架空線路、高壓電纜等設備中獲取的高速增長的監(jiān)測數(shù)據(jù),光伏和風電功率預測所需的大量的歷史運行數(shù)據(jù)、氣象觀測數(shù)據(jù)等。
因此在電力系統(tǒng)數(shù)據(jù)爆炸式增長的新形勢下,傳統(tǒng)的數(shù)據(jù)處理技術遇到瓶頸,不能滿足電力行業(yè)從海量數(shù)據(jù)中快速獲取知識與信息的分析需求,電力大數(shù)據(jù)技術的應用是電力行業(yè)信息化、智能化發(fā)展的必然要求。
中國電機工程學會信息化專委會在2013年3月發(fā)布了《中國電力大數(shù)據(jù)發(fā)展白皮書》,將2013 年定為“中國大數(shù)據(jù)元年”,掀起了電力大數(shù)據(jù)的研究熱潮。根據(jù)白皮書描述,電力大數(shù)據(jù)的特征可概括為3V和3E。3V為體量大(Volume)、速度快(Velocity)和類型多(Variety) ; 3E 為數(shù)據(jù)即能量(Energy) 、數(shù)據(jù)即交互(Exchange)和數(shù)據(jù)即共情(Empathy)。
其3V的描述和其他行業(yè)的描述比較接近,3E的描述具有典型的電力行業(yè)特征,體現(xiàn)了大數(shù)據(jù)在電力系統(tǒng)應用中的巨大價值。數(shù)據(jù)即能量簡而言之,就是指通過大數(shù)據(jù)分析達到節(jié)能的目的,電力大數(shù)據(jù)應用的過程,就是電力數(shù)據(jù)能量釋放的過程;數(shù)據(jù)即交互是指電力大數(shù)據(jù)與國民經(jīng)濟其他領域數(shù)據(jù)進行交互融合,才能發(fā)揮其更大價值;數(shù)據(jù)即共情是指電力大數(shù)據(jù)緊密聯(lián)系千家萬戶、廠礦企業(yè),只有情系用電客戶,滿足客戶需求,電力企業(yè)方能以數(shù)據(jù)取勝。
電力大數(shù)據(jù)貫穿發(fā)、輸、變、配、用等電力生產(chǎn)及管理的各個環(huán)節(jié),是能源變革中電力工業(yè)技術革新的必然過程,不僅是技術上的進步,更是涉及電力系統(tǒng)管理體制、發(fā)展理念和技術路線等方面的重大變革,是下一代電力系統(tǒng)在大數(shù)據(jù)時代下價值形態(tài)的躍升。對建設堅強智能電網(wǎng)而言,亟需開展大數(shù)據(jù)相關技術的研究,為電力大數(shù)據(jù)時代的到來奠定理論基礎和技術積累。
1 智能電網(wǎng)、云計算和大數(shù)據(jù)的關系
1.1 智能電網(wǎng)與大數(shù)據(jù)的關系
智能電網(wǎng)就是將信息技術、計算機技術、通信技術和原有輸、配電基礎設施高度集成而形成的新型電網(wǎng),具有提高能源效率、提高供電安全性、減少環(huán)境影響、提高供電可靠性、減少輸電網(wǎng)電能損耗等優(yōu)點。
智能電網(wǎng)的理念是通過獲取更多的用戶如何用電、怎樣用電的信息,來優(yōu)化電的生產(chǎn)、分配及消耗,利用現(xiàn)代網(wǎng)絡、通信和信息技術進行信息海量交互,來實現(xiàn)電網(wǎng)設備間信息交換,并自動完成信息采集、測量、控制、保護、計量和監(jiān)測等基本功能,可根據(jù)需要支持電網(wǎng)實時自動化控制、智能調(diào)節(jié)、在線分析決策和協(xié)同互動等高級功能,因此相關研究者指出:可以抽象的認為,智能電網(wǎng)就是大數(shù)據(jù)這個概念在電力行業(yè)中的應用。
1.2 大數(shù)據(jù)與云計算的關系
根據(jù)美國國家標準與技術研究院的定義,云計算是一種利用互聯(lián)網(wǎng)實現(xiàn)隨時、隨地、按需、便捷地訪問共享資源池(如計算設施、應用程序、存儲設備等)的計算模式。
從技術上看,大數(shù)據(jù)根植于云計算,云計算的數(shù)據(jù)存儲、管理與分析方面的技術是大數(shù)據(jù)技術的基礎。利用云計算強大的計算能力,可以更加迅速地處理大數(shù)據(jù),并更方便地提供服務;通過大數(shù)據(jù)的業(yè)務需求,可以為云計算的發(fā)展找到更多更好的實際應用。
云計算使大數(shù)據(jù)應用成為可能,但是沒有大數(shù)據(jù)的信息沉淀,云計算的功能將得不到完全發(fā)揮,所以從整體上看,大數(shù)據(jù)與云計算是相輔相成的。
云計算和大數(shù)據(jù)的側(cè)重點不同,因此也有較大的差別。大數(shù)據(jù)關注重心在于數(shù)據(jù)背后的信息沉淀與業(yè)務分析,因此其推動力量來源于擁有大數(shù)據(jù)的企業(yè)和軟件廠商;云計算關注重心在于計算能力,偏重于技術解決方案,因此其推動力量來自于計算資源和存儲資源的生產(chǎn)廠商。
云計算技術的發(fā)展早于大數(shù)據(jù)技術的發(fā)展,但是大數(shù)據(jù)的業(yè)務需求又為云計算技術的發(fā)展帶來新的機遇,一方面促進了云計算技術向更加貼近用戶需求的方向發(fā)展,另一方面帶來了更高處理速度、更大存儲容量的要求。
1.3 智能電網(wǎng)、云計算、大數(shù)據(jù)的相互關系
云計算能夠整合智能電網(wǎng)系統(tǒng)內(nèi)部計算處理和存儲資源,提高電網(wǎng)處理和交互能力,成為電網(wǎng)強有力的技術組成;大數(shù)據(jù)技術立足于業(yè)務服務需求,根植于云計算,以云計算技術為基礎;智能電網(wǎng)可以抽象的認為是大數(shù)據(jù)這個概念在電力中的應用,所以三者是彼此交互的關系。
智能電網(wǎng)、云計算、大數(shù)據(jù)三者之間的關系,從更加深層次來講,是電力系統(tǒng)發(fā)展到不同階段的產(chǎn)物,具有代紀傳承的特點。
智能電網(wǎng)是信息技術、計算機技術、人工智能技術等在傳統(tǒng)電網(wǎng)上應用沉淀的結(jié)果,滿足電網(wǎng)信息化、智能化、清潔化等高層次的運營和管理需求,既是對傳統(tǒng)電網(wǎng)的繼承,也是對傳統(tǒng)電網(wǎng)的發(fā)揚,所以其發(fā)展必然與新技術同步。
來自于計算機和信息技術領域最前沿的云計算技術和大數(shù)據(jù)技術,正是其發(fā)展階段技術層面和應用層面兩個具有劃時代意義的新技術。云計算技術中的分布式存儲技術和并行計算技術,滿足了電網(wǎng)海量數(shù)據(jù)的存儲和計算需求,因此云計算技術推出不久,電力云的概念就提出來,云計算技術在電力系統(tǒng)中的應用也逐漸呈現(xiàn)出百花齊放的態(tài)勢,推動了智能電網(wǎng)的發(fā)展。
大數(shù)據(jù)技術既是傳統(tǒng)數(shù)據(jù)分析與挖掘技術的延續(xù),也是數(shù)據(jù)量級增長到一定階段時知識挖掘與業(yè)務應用需求的必然產(chǎn)物,因此大數(shù)據(jù)技術的大部分應用都以云計算的關鍵技術或者與云計算類似的分布式存儲和處理技術為基礎。電力大數(shù)據(jù)技術的發(fā)展從某種意義上講,可以看成是云計算技術在智能電網(wǎng)中,高級業(yè)務需求的實現(xiàn)過程。
2 電力大數(shù)據(jù)平臺的總體架構(gòu)
Apache基金會開源技術通用的大數(shù)據(jù)平臺整體架構(gòu)具有較好的通用性,適用于電力企業(yè)大數(shù)據(jù)的規(guī)劃,其主要思想是利用基于Hadoop文件系統(tǒng)(Hadoopdistributed file system,HDFS)的分布式文件處理系統(tǒng)作為大數(shù)據(jù)的存儲框架,利用基于MapReduce的分布式計算技術作為大數(shù)據(jù)的處理框架。
以分布式文件處理技術為基礎,使PB、ZB級的數(shù)據(jù)存儲成為可能;以分布式計算技術為基礎,使得PB、ZB級數(shù)據(jù)的查詢分析成為可能。另外該框架中還包含商業(yè)智能應用、傳統(tǒng)的數(shù)據(jù)倉庫、大數(shù)據(jù)訪問框架、大數(shù)據(jù)調(diào)度框架、網(wǎng)絡層、操作系統(tǒng)、服務器、備份和恢復、數(shù)據(jù)管理等模塊。
大數(shù)據(jù)存儲框架和大數(shù)據(jù)處理框架通常構(gòu)建在通用的服務器、操作系統(tǒng)或者虛擬機上,使得該架構(gòu)所需的硬件具有低成本和高擴展性的特點,標準的普通服務器或者PC機即可成為基于該架構(gòu)的終端構(gòu)成單元。
大數(shù)據(jù)存儲框架和大數(shù)據(jù)處理框架之上是通過網(wǎng)絡層連接的大數(shù)據(jù)訪問框架,該訪問框架包含并行計算機編程語言Pig、數(shù)據(jù)倉庫工具Hive、開源數(shù)據(jù)傳遞工具Sqoop 等子模塊。
大數(shù)據(jù)調(diào)度框架包含基于列存儲的開源非關系型數(shù)據(jù)庫Hbase、數(shù)據(jù)序列化格式與傳輸工具Avro、日志收集系統(tǒng)Flume、分布式鎖設施ZooKeeper等模塊。
大數(shù)據(jù)調(diào)度框架實現(xiàn)了對大數(shù)據(jù)的組織與調(diào)度,為數(shù)據(jù)分析提供了必要條件。在大數(shù)據(jù)調(diào)度框架之上是企業(yè)級商業(yè)智能應用系統(tǒng),可以開展查詢、分析、統(tǒng)計、報表等高級應用。大數(shù)據(jù)的管理、安全和備份恢復框架幫助進行大數(shù)據(jù)的治理和保護。
該框架幾乎涵蓋了大數(shù)據(jù)技術的所有環(huán)節(jié),值得指出的是,通過該訪問框架不僅可以實現(xiàn)對分布式文件存儲系統(tǒng)的訪問,而且通過大數(shù)據(jù)連接器和開源數(shù)據(jù)傳遞工具Sqoop可以實現(xiàn)對傳統(tǒng)數(shù)據(jù)倉庫的訪問。
大數(shù)據(jù)的處理流程可以定義為在合適工具的輔助下,對廣泛異構(gòu)的數(shù)據(jù)源進行抽取和集成,按照統(tǒng)一的標準對結(jié)果進行存儲,利用恰當?shù)臄?shù)據(jù)分析技術對存儲的數(shù)據(jù)進行分析,達到從中提取出有價值的知識的目的,并用合適的方式將結(jié)果展現(xiàn)給終端用戶。
對電力企業(yè)來講,電力大數(shù)據(jù)的基本處理流程與傳統(tǒng)數(shù)據(jù)處理流程并無太大差異,主要區(qū)別在于:電力大數(shù)據(jù)需要處理大量、非結(jié)構(gòu)的數(shù)據(jù),所以在各個環(huán)節(jié)都可以采用MapReduce等方式進行并行處理。
電力系統(tǒng)是一種高維非線性的復雜系統(tǒng),其內(nèi)部的數(shù)據(jù)流包含電力流、信息流、業(yè)務流、故障流、氣象流等不同的數(shù)據(jù)流向。
對這些電力系統(tǒng)的子信息源而言,一方面可以單獨應用大數(shù)據(jù)技術,提升其產(chǎn)業(yè)價值,例如電力設備在線監(jiān)測系統(tǒng)本身就是一個大數(shù)據(jù)系統(tǒng),另一方面可以融合不同的子信息源,在更高的層面上構(gòu)件大數(shù)據(jù)平臺,例如融合電能計量系統(tǒng)、SCADA系統(tǒng)、MIS系統(tǒng)、負荷控制系統(tǒng),可以構(gòu)建基于大數(shù)據(jù)平臺的網(wǎng)損分析系統(tǒng),實現(xiàn)網(wǎng)損的自動統(tǒng)計與分析。
基于該網(wǎng)損分析大數(shù)據(jù)平臺,還可開展基于自動網(wǎng)損統(tǒng)計的用戶竊電行為挖掘,實現(xiàn)更深層次的應用。
3 電力大數(shù)據(jù)關鍵技術
3.1 電力大數(shù)據(jù)的集成管理技術
電力企業(yè)數(shù)據(jù)集成管理技術是合并來自2個或者多個應用系統(tǒng)的數(shù)據(jù),創(chuàng)建一個具有更多功能的企業(yè)應用的過程。從集成的角度來說,就是把不同來源、格式、特點、性質(zhì)的數(shù)據(jù)在邏輯上或者存儲介質(zhì)上有機地集中,為系統(tǒng)存儲一系列面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,從而為系統(tǒng)提供全面的數(shù)據(jù)共享。電力企業(yè)集成管理技術就是為解決電力企業(yè)內(nèi)部各系統(tǒng)間的數(shù)據(jù)冗余和信息孤島而產(chǎn)生的。
電力大數(shù)據(jù)的數(shù)據(jù)集成管理技術,包含關系型和非關系型數(shù)據(jù)庫技術、數(shù)據(jù)融合和集成技術、數(shù)據(jù)抽取技術、過濾技術和數(shù)據(jù)清洗等。大數(shù)據(jù)的一個重要特點就是多樣性,這就意味著數(shù)據(jù)來源極其廣泛,數(shù)據(jù)類型極為繁雜,這種復雜的數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來極大的挑戰(zhàn),要想處理大數(shù)據(jù),首先必須對數(shù)據(jù)源的數(shù)據(jù)進行抽取和集成,從中提取出實體和關系,經(jīng)過關聯(lián)和聚合之后采用統(tǒng)一的結(jié)構(gòu)來存儲這些數(shù)據(jù),在數(shù)據(jù)集成和提取時需要對數(shù)據(jù)進行清洗,保證數(shù)據(jù)質(zhì)量及可靠性。
大數(shù)據(jù)存儲管理中一個重要的技術是NoSQL數(shù)據(jù)庫技術,它采用分布式數(shù)據(jù)存儲方式,去掉了關系型數(shù)據(jù)庫的關系型特性,數(shù)據(jù)存儲被簡化且更加靈活,具有良好的可擴展性,解決了海量數(shù)據(jù)的存儲難題。有代表性的NoSQL 數(shù)據(jù)庫技術有Google的BigTable和Amazon的Dynamo等。
3.2 電力大數(shù)據(jù)的數(shù)據(jù)分析技術
大數(shù)據(jù)技術的根本驅(qū)動力是將信號轉(zhuǎn)化為數(shù)據(jù),將數(shù)據(jù)分析為信息,將信息提煉為知識,以知識促成決策和行動。借助電力大數(shù)據(jù)的分析技術可以從電力系統(tǒng)的海量數(shù)據(jù)中找出潛在的模態(tài)與規(guī)律,為決策人員提供決策支持。
麥肯錫認為可用于大數(shù)據(jù)分析的關鍵技術源于統(tǒng)計學和計算機科學等學科,包含關聯(lián)分析、機器學習、數(shù)據(jù)挖掘、模式識別、神經(jīng)網(wǎng)絡、時間序列預測模型、遺傳算法等多種不同的方法。
大數(shù)據(jù)研究不同于傳統(tǒng)的邏輯推理研究,是對巨大數(shù)量的數(shù)據(jù)做統(tǒng)計性的搜索、分類、比較、聚類等的分析和歸納,因此繼承了統(tǒng)計科學的一些特點,如統(tǒng)計學關注的數(shù)據(jù)相關性或稱關聯(lián)性,所謂“相關性”是指2個或2個以上變量的取值之間存在某種規(guī)律性[7]!跋嚓P分析”的目的是找出數(shù)據(jù)集里隱藏的關系網(wǎng),一般用支持度、可信度、興趣度等參數(shù)反映相關性。
牛津大學網(wǎng)絡學院教授維克多在他的著作《大數(shù)據(jù)時代》中指出:在大數(shù)據(jù)時代,相關關系分析法將大放異彩,通過找到一個良好現(xiàn)象的關聯(lián)物,相關關系分析可以捕獲現(xiàn)在和預測未來。大數(shù)據(jù)相關關系分析法,建立在海量樣本的基礎上,不采用隨機分析法這樣的捷徑,而采用分析所有數(shù)據(jù)的方法;大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效,其結(jié)果更快、更準確而且不易受到干擾,因此他指出建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。
大數(shù)據(jù)這種不注重因果關系側(cè)重于相關關系的分析方法,帶來了科學研究思維方式的重大轉(zhuǎn)變,已故圖靈獎得主吉姆˙格雷提出的數(shù)據(jù)密集型科研“第四范式”,將大數(shù)據(jù)科研從前3 種范式(理論科學、計算科學、實驗科學)中分離出來,單獨作為一種科研范式,正是因為其研究方式不同于基于數(shù)學模型的傳統(tǒng)研究方式。
電力大數(shù)據(jù)分析技術,從根本上講,屬于傳統(tǒng)數(shù)據(jù)挖掘技術在海量數(shù)據(jù)挖掘下的新發(fā)展,但由于大數(shù)據(jù)海量、高速增長、多樣性的特點,并且不僅包含結(jié)構(gòu)化數(shù)據(jù),還含半結(jié)構(gòu)化和非機構(gòu)化數(shù)據(jù),因此傳統(tǒng)的很多處理小數(shù)據(jù)的數(shù)據(jù)挖掘方法已經(jīng)不再實用。
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘與機器學習算法,可以從3個方面著手:1)從大數(shù)據(jù)的治理與抽樣、特征選擇的角度入手,將大數(shù)據(jù)小數(shù)據(jù)化;2)開展大數(shù)據(jù)下的聚類、分類算法研究,例如基于共軛度的最小二乘支持向量機(least squares support vector machine,LS-SVM)],隨機可擴展FuzzyC-Means (FCM)等;3)開展大數(shù)據(jù)的并行算法,將傳統(tǒng)的數(shù)據(jù)挖掘方法通過并行化,應用到大數(shù)據(jù)的知識挖掘中,例如基于MapReduce的機器學習與知識挖掘。
3.3 電力大數(shù)據(jù)的數(shù)據(jù)處理技術
電力大數(shù)據(jù)的數(shù)據(jù)處理技術包括分布式計算技術,內(nèi)存計算技術,流處理技術等。分布式計算技術是為了解決大規(guī)模數(shù)據(jù)的分布式存儲與處理。內(nèi)存計算技術是為了解決數(shù)據(jù)的高效讀取和處理在線的實時計算。流處理技術則是為了處理實時到達的、速度和規(guī)模不受控制的數(shù)據(jù)。
分布式計算是一種新的計算方式,研究如何將一個需要強大計算能力才能解決的問題分解為許多小的部分,然后再將這些部分分給多個計算機處理,最后把結(jié)果綜合起來得到最終結(jié)果。
分布式計算的一個典型代表是Google公司提出的MapReduce編程模型,該模型先將待處理的數(shù)據(jù)進行分塊,交給不同的Map任務區(qū)處理,并按鍵值存儲到本地硬盤,再用Reduce任務按照鍵值將結(jié)果匯總并輸出最終結(jié)果。分布式技術適用于電力系統(tǒng)信息采集領域的大規(guī)模分散數(shù)據(jù)源。
內(nèi)存計算技術是將數(shù)據(jù)全部放在內(nèi)層中進行操作的計算技術,該技術克服了對磁盤讀寫操作時的大量時間消耗,計算速度得到幾個數(shù)量級的大幅提升。內(nèi)層計算技術伴隨著大數(shù)據(jù)浪潮的來臨和內(nèi)存價格的下降得到快速的發(fā)展和廣泛的應用,EMC、甲骨文、SAT都推出了內(nèi)存計算的解決方案,將客戶以前需要以天作為時間計算單位的業(yè)務降低為以秒作為時間計算單位,解決了大數(shù)據(jù)實時分析和知識挖掘的難題。
流處理的處理模型是將源源不斷的數(shù)據(jù)組視為流,當新的數(shù)據(jù)到來時就立即處理并返回結(jié)果,其基本理念是數(shù)據(jù)的價值會隨著時間的流逝而不斷減少,因此盡可能快地對最新的數(shù)據(jù)做出分析并給出結(jié)果,其應用場景主要有網(wǎng)頁點擊的實時統(tǒng)計、傳感器網(wǎng)絡、金融中的高頻交易等[8]。
隨著電力事業(yè)的發(fā)展,電力系統(tǒng)數(shù)據(jù)量不斷增長,對實時性的要求也越來越高,將數(shù)據(jù)流技術應用于電力系統(tǒng)可以為決策者提供即時依據(jù),滿足實時在線分析需求。
3.4 電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術
電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術包括可視化技術、空間信息流展示技術、歷史流展示技術等?梢暬夹g、空間信息流展示技術、歷史流展示技術從3個不同的方面詮釋了電力大數(shù)據(jù)展現(xiàn)技術的豐富內(nèi)涵。借助電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術可幫助管理人員更直觀、準確地理解電力系統(tǒng)數(shù)據(jù)表達的意義,了解電力系統(tǒng)的運行狀態(tài)。
可視化技術廣泛應用于電網(wǎng)狀態(tài)的實時監(jiān)控,顯著提高了電力系統(tǒng)的自動化水平。未來電力系統(tǒng)可視化還可結(jié)合復雜網(wǎng)絡中的相關理論在電網(wǎng)自動分層分區(qū)、自動布點等方面展開深入研究,發(fā)掘電網(wǎng)更深層次的規(guī)律和聯(lián)系。
空間信息流展示技術主要體現(xiàn)在電網(wǎng)參數(shù)與已有地理信息系統(tǒng)的結(jié)合上,包含變電站三維展示、虛擬現(xiàn)實等技術。將電力配電設備管理與地理信息系統(tǒng)緊密結(jié)合起來,有利于電網(wǎng)管理人員直觀地了解設備情況,從而為其決策提供最新的地理信息。在變電站工程設計中用空間信息流展示技術可以節(jié)約時間、資源、成本,為電力企業(yè)帶來巨大的效益。
歷史流展示技術體現(xiàn)在對電網(wǎng)歷史數(shù)據(jù)的管理與展示上。在電力系統(tǒng)中,深層次的應用分析往往以歷史數(shù)據(jù)為基礎。對生產(chǎn)現(xiàn)場的實時監(jiān)測數(shù)據(jù)、電網(wǎng)的規(guī)劃數(shù)據(jù)和負荷預測數(shù)據(jù),通過歷史流展示技術,可以繪制出數(shù)據(jù)的發(fā)展趨勢并預測出未來的數(shù)據(jù)走勢;通過歷史流回放展示技術,可以模擬歷史重大事件發(fā)生、演變,挖掘歷史事件潛在的知識與規(guī)律。
4 大數(shù)據(jù)在智能電網(wǎng)中的應用
電力大數(shù)據(jù)的應用場合涵蓋發(fā)、輸、變、配、用、調(diào)等電力行業(yè)的各個環(huán)節(jié),在風電場選址、降低網(wǎng)損、風電并網(wǎng)、電網(wǎng)安全監(jiān)測、大災難預警、電力企業(yè)精細化運營、電力設備狀態(tài)監(jiān)測等領域有非常強的可實現(xiàn)性。
5 結(jié)論與展望
本文探討了大數(shù)據(jù)、云計算、智能電網(wǎng)三者之間的相互關系,并給出電力大數(shù)據(jù)的總體可執(zhí)行框架,對電力企業(yè)大數(shù)據(jù)平臺的搭建具有參考價值。
本文闡述了電力大數(shù)據(jù)平臺中4個核心的關鍵技術,即集成管理技術、分析技術、處理技術、展現(xiàn)技術。大數(shù)據(jù)的集成管理技術應該考慮關系型和非關系型數(shù)據(jù)庫技術的綜合應用,并重點考慮NoSQL數(shù)據(jù)庫技術;大數(shù)據(jù)的分析技術應從大數(shù)據(jù)的治理與抽樣、大數(shù)據(jù)特征選擇、大數(shù)據(jù)小數(shù)據(jù)化、大數(shù)據(jù)的分類算法、大數(shù)據(jù)挖掘并行化等方面開展研究;大數(shù)據(jù)的處理技術應根據(jù)具體的應用需求考慮分布式計算、內(nèi)存計算、流處理等技術;電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術可考慮可視化技術、空間信息流展示技術、歷史流展示技術等。
大數(shù)據(jù)技術在商業(yè)領域已經(jīng)獲得較為廣泛的應用并創(chuàng)造出巨大的商業(yè)價值,但是在電力系統(tǒng)中的應用才剛剛起步,因此結(jié)合大數(shù)據(jù)的技術優(yōu)勢和電力系統(tǒng)的應用需求,發(fā)揮電力大數(shù)據(jù)的價值,將為智能電網(wǎng)的建設帶來新的發(fā)展契機。
電力企業(yè)應該牢牢抓住這個契機,從數(shù)據(jù)政策、人才培養(yǎng)、關鍵技術研發(fā)等層面,全面促成電力大數(shù)據(jù)技術的發(fā)展。
保定市四北電子有限公司具有卓越的產(chǎn)品性能、優(yōu)良的品質(zhì)、高可靠的電源設計,并提供定制開關電源服務,F(xiàn)已形成幾大系列產(chǎn)品:開關電源系列、逆變電源系列、充電電源系列、備用電源系列等產(chǎn)品。提供AC/DC、DC/DC、DC/AC基板式、模塊式、嵌入式等各種形式專用電源。
主要電源類別有:電力自動化設備專用電源;通訊領域?qū)S秒娫;電力測試儀器專用電源;機車控制系統(tǒng)電源:高壓激光電源;浮充電電源;UPS電源;伺服式交流穩(wěn)壓電源;ZDD系列20W∽3KW逆變電源。http://www.szdaixie.com
早在2008 年Nature就出版了?癇ig Data”,從網(wǎng)絡經(jīng)濟學、超級計算、互聯(lián)網(wǎng)技術、生物醫(yī)藥、環(huán)境科學等多個方面介紹了海量數(shù)據(jù)帶來的挑戰(zhàn);2011年Science推出數(shù)據(jù)處理的?癉ealing With Data”,深入討論了數(shù)據(jù)洪流(datadeluge,DD)所帶來的挑戰(zhàn),并指出如果能夠更有效地組織和利用這些海量數(shù)據(jù),人們將得到更多的機會發(fā)揮科學技術對推動社會發(fā)展的巨大作用;2012年奧巴馬宣布美國政府投資2億美元啟動“大數(shù)據(jù)研究和發(fā)展計劃”,將大數(shù)據(jù)比喻為“未來的新石油”,將對大數(shù)據(jù)的研究上升為國家意志,掀起了世界各國大數(shù)據(jù)的研究熱潮。
大數(shù)據(jù)的定義,業(yè)界雖然有一些共識,但是并未有統(tǒng)一的定義。麥肯錫認為“大數(shù)據(jù)是指其大小超出典型數(shù)據(jù)軟件抓取、儲存、管理和分析范圍的數(shù)據(jù)集合”;Gartner認為“大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)”。
在對大數(shù)據(jù)的定義中,比較有代表性的定義是3V定義,即規(guī)模性(Volume),多樣性(Variety)和高速性(Velocity),規(guī)模性是指數(shù)據(jù)量龐大,數(shù)據(jù)洪流已經(jīng)從GB、TB級上升到PB、EB、ZB級;多樣性是指數(shù)據(jù)類型繁多,并且包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù);高速性則是指數(shù)據(jù)以數(shù)據(jù)流的形態(tài)快速、動態(tài)的產(chǎn)生,數(shù)據(jù)處理的速度也必須達到高速實時處理。
另外大數(shù)據(jù)第4V的討論并沒有取得一致的結(jié)論,國際數(shù)據(jù)公司(international data corporation, IDC)認為大數(shù)據(jù)應該具有價值性(Value),且價值密度稀疏;IBM則認為大數(shù)據(jù)的第4V特性是真實性(Veracity)。大數(shù)據(jù)的這些特點決定了在大數(shù)據(jù)時代,傳統(tǒng)的數(shù)據(jù)處理技術必需有革命性的提升。
電力系統(tǒng)作為經(jīng)濟發(fā)展和人類生活依賴的能量供給系統(tǒng),也具有大數(shù)據(jù)的典型特征。電力系統(tǒng)是最復雜的人造系統(tǒng)之一,其具有地理位置分布廣泛、發(fā)電用電實時平衡、傳輸能量數(shù)量龐大、電能傳輸光速可達、通訊調(diào)度高度可靠、實時運行從不停止、重大故障瞬間擴大等特點,這些特點決定了電力系統(tǒng)運行時產(chǎn)生的數(shù)據(jù)數(shù)量龐大、增長快速、類型豐富,完全符合大數(shù)據(jù)的所有特征,是典型的大數(shù)據(jù)。
在智能電網(wǎng)深入推進的形勢下,電力系統(tǒng)的數(shù)字化、信息化、智能化不斷發(fā)展,帶來了更多的數(shù)據(jù)源,例如智能電表從數(shù)以億計的家庭和企業(yè)終端帶來的數(shù)據(jù),電力設備狀態(tài)監(jiān)測系統(tǒng)從數(shù)以萬計的發(fā)電機、變壓器、開關設備、架空線路、高壓電纜等設備中獲取的高速增長的監(jiān)測數(shù)據(jù),光伏和風電功率預測所需的大量的歷史運行數(shù)據(jù)、氣象觀測數(shù)據(jù)等。
因此在電力系統(tǒng)數(shù)據(jù)爆炸式增長的新形勢下,傳統(tǒng)的數(shù)據(jù)處理技術遇到瓶頸,不能滿足電力行業(yè)從海量數(shù)據(jù)中快速獲取知識與信息的分析需求,電力大數(shù)據(jù)技術的應用是電力行業(yè)信息化、智能化發(fā)展的必然要求。
中國電機工程學會信息化專委會在2013年3月發(fā)布了《中國電力大數(shù)據(jù)發(fā)展白皮書》,將2013 年定為“中國大數(shù)據(jù)元年”,掀起了電力大數(shù)據(jù)的研究熱潮。根據(jù)白皮書描述,電力大數(shù)據(jù)的特征可概括為3V和3E。3V為體量大(Volume)、速度快(Velocity)和類型多(Variety) ; 3E 為數(shù)據(jù)即能量(Energy) 、數(shù)據(jù)即交互(Exchange)和數(shù)據(jù)即共情(Empathy)。
其3V的描述和其他行業(yè)的描述比較接近,3E的描述具有典型的電力行業(yè)特征,體現(xiàn)了大數(shù)據(jù)在電力系統(tǒng)應用中的巨大價值。數(shù)據(jù)即能量簡而言之,就是指通過大數(shù)據(jù)分析達到節(jié)能的目的,電力大數(shù)據(jù)應用的過程,就是電力數(shù)據(jù)能量釋放的過程;數(shù)據(jù)即交互是指電力大數(shù)據(jù)與國民經(jīng)濟其他領域數(shù)據(jù)進行交互融合,才能發(fā)揮其更大價值;數(shù)據(jù)即共情是指電力大數(shù)據(jù)緊密聯(lián)系千家萬戶、廠礦企業(yè),只有情系用電客戶,滿足客戶需求,電力企業(yè)方能以數(shù)據(jù)取勝。
電力大數(shù)據(jù)貫穿發(fā)、輸、變、配、用等電力生產(chǎn)及管理的各個環(huán)節(jié),是能源變革中電力工業(yè)技術革新的必然過程,不僅是技術上的進步,更是涉及電力系統(tǒng)管理體制、發(fā)展理念和技術路線等方面的重大變革,是下一代電力系統(tǒng)在大數(shù)據(jù)時代下價值形態(tài)的躍升。對建設堅強智能電網(wǎng)而言,亟需開展大數(shù)據(jù)相關技術的研究,為電力大數(shù)據(jù)時代的到來奠定理論基礎和技術積累。
1 智能電網(wǎng)、云計算和大數(shù)據(jù)的關系
1.1 智能電網(wǎng)與大數(shù)據(jù)的關系
智能電網(wǎng)就是將信息技術、計算機技術、通信技術和原有輸、配電基礎設施高度集成而形成的新型電網(wǎng),具有提高能源效率、提高供電安全性、減少環(huán)境影響、提高供電可靠性、減少輸電網(wǎng)電能損耗等優(yōu)點。
智能電網(wǎng)的理念是通過獲取更多的用戶如何用電、怎樣用電的信息,來優(yōu)化電的生產(chǎn)、分配及消耗,利用現(xiàn)代網(wǎng)絡、通信和信息技術進行信息海量交互,來實現(xiàn)電網(wǎng)設備間信息交換,并自動完成信息采集、測量、控制、保護、計量和監(jiān)測等基本功能,可根據(jù)需要支持電網(wǎng)實時自動化控制、智能調(diào)節(jié)、在線分析決策和協(xié)同互動等高級功能,因此相關研究者指出:可以抽象的認為,智能電網(wǎng)就是大數(shù)據(jù)這個概念在電力行業(yè)中的應用。
1.2 大數(shù)據(jù)與云計算的關系
根據(jù)美國國家標準與技術研究院的定義,云計算是一種利用互聯(lián)網(wǎng)實現(xiàn)隨時、隨地、按需、便捷地訪問共享資源池(如計算設施、應用程序、存儲設備等)的計算模式。
從技術上看,大數(shù)據(jù)根植于云計算,云計算的數(shù)據(jù)存儲、管理與分析方面的技術是大數(shù)據(jù)技術的基礎。利用云計算強大的計算能力,可以更加迅速地處理大數(shù)據(jù),并更方便地提供服務;通過大數(shù)據(jù)的業(yè)務需求,可以為云計算的發(fā)展找到更多更好的實際應用。
云計算使大數(shù)據(jù)應用成為可能,但是沒有大數(shù)據(jù)的信息沉淀,云計算的功能將得不到完全發(fā)揮,所以從整體上看,大數(shù)據(jù)與云計算是相輔相成的。
云計算和大數(shù)據(jù)的側(cè)重點不同,因此也有較大的差別。大數(shù)據(jù)關注重心在于數(shù)據(jù)背后的信息沉淀與業(yè)務分析,因此其推動力量來源于擁有大數(shù)據(jù)的企業(yè)和軟件廠商;云計算關注重心在于計算能力,偏重于技術解決方案,因此其推動力量來自于計算資源和存儲資源的生產(chǎn)廠商。
云計算技術的發(fā)展早于大數(shù)據(jù)技術的發(fā)展,但是大數(shù)據(jù)的業(yè)務需求又為云計算技術的發(fā)展帶來新的機遇,一方面促進了云計算技術向更加貼近用戶需求的方向發(fā)展,另一方面帶來了更高處理速度、更大存儲容量的要求。
1.3 智能電網(wǎng)、云計算、大數(shù)據(jù)的相互關系
云計算能夠整合智能電網(wǎng)系統(tǒng)內(nèi)部計算處理和存儲資源,提高電網(wǎng)處理和交互能力,成為電網(wǎng)強有力的技術組成;大數(shù)據(jù)技術立足于業(yè)務服務需求,根植于云計算,以云計算技術為基礎;智能電網(wǎng)可以抽象的認為是大數(shù)據(jù)這個概念在電力中的應用,所以三者是彼此交互的關系。
智能電網(wǎng)、云計算、大數(shù)據(jù)三者之間的關系,從更加深層次來講,是電力系統(tǒng)發(fā)展到不同階段的產(chǎn)物,具有代紀傳承的特點。
智能電網(wǎng)是信息技術、計算機技術、人工智能技術等在傳統(tǒng)電網(wǎng)上應用沉淀的結(jié)果,滿足電網(wǎng)信息化、智能化、清潔化等高層次的運營和管理需求,既是對傳統(tǒng)電網(wǎng)的繼承,也是對傳統(tǒng)電網(wǎng)的發(fā)揚,所以其發(fā)展必然與新技術同步。
來自于計算機和信息技術領域最前沿的云計算技術和大數(shù)據(jù)技術,正是其發(fā)展階段技術層面和應用層面兩個具有劃時代意義的新技術。云計算技術中的分布式存儲技術和并行計算技術,滿足了電網(wǎng)海量數(shù)據(jù)的存儲和計算需求,因此云計算技術推出不久,電力云的概念就提出來,云計算技術在電力系統(tǒng)中的應用也逐漸呈現(xiàn)出百花齊放的態(tài)勢,推動了智能電網(wǎng)的發(fā)展。
大數(shù)據(jù)技術既是傳統(tǒng)數(shù)據(jù)分析與挖掘技術的延續(xù),也是數(shù)據(jù)量級增長到一定階段時知識挖掘與業(yè)務應用需求的必然產(chǎn)物,因此大數(shù)據(jù)技術的大部分應用都以云計算的關鍵技術或者與云計算類似的分布式存儲和處理技術為基礎。電力大數(shù)據(jù)技術的發(fā)展從某種意義上講,可以看成是云計算技術在智能電網(wǎng)中,高級業(yè)務需求的實現(xiàn)過程。
2 電力大數(shù)據(jù)平臺的總體架構(gòu)
Apache基金會開源技術通用的大數(shù)據(jù)平臺整體架構(gòu)具有較好的通用性,適用于電力企業(yè)大數(shù)據(jù)的規(guī)劃,其主要思想是利用基于Hadoop文件系統(tǒng)(Hadoopdistributed file system,HDFS)的分布式文件處理系統(tǒng)作為大數(shù)據(jù)的存儲框架,利用基于MapReduce的分布式計算技術作為大數(shù)據(jù)的處理框架。
以分布式文件處理技術為基礎,使PB、ZB級的數(shù)據(jù)存儲成為可能;以分布式計算技術為基礎,使得PB、ZB級數(shù)據(jù)的查詢分析成為可能。另外該框架中還包含商業(yè)智能應用、傳統(tǒng)的數(shù)據(jù)倉庫、大數(shù)據(jù)訪問框架、大數(shù)據(jù)調(diào)度框架、網(wǎng)絡層、操作系統(tǒng)、服務器、備份和恢復、數(shù)據(jù)管理等模塊。
大數(shù)據(jù)存儲框架和大數(shù)據(jù)處理框架通常構(gòu)建在通用的服務器、操作系統(tǒng)或者虛擬機上,使得該架構(gòu)所需的硬件具有低成本和高擴展性的特點,標準的普通服務器或者PC機即可成為基于該架構(gòu)的終端構(gòu)成單元。
大數(shù)據(jù)存儲框架和大數(shù)據(jù)處理框架之上是通過網(wǎng)絡層連接的大數(shù)據(jù)訪問框架,該訪問框架包含并行計算機編程語言Pig、數(shù)據(jù)倉庫工具Hive、開源數(shù)據(jù)傳遞工具Sqoop 等子模塊。
大數(shù)據(jù)調(diào)度框架包含基于列存儲的開源非關系型數(shù)據(jù)庫Hbase、數(shù)據(jù)序列化格式與傳輸工具Avro、日志收集系統(tǒng)Flume、分布式鎖設施ZooKeeper等模塊。
大數(shù)據(jù)調(diào)度框架實現(xiàn)了對大數(shù)據(jù)的組織與調(diào)度,為數(shù)據(jù)分析提供了必要條件。在大數(shù)據(jù)調(diào)度框架之上是企業(yè)級商業(yè)智能應用系統(tǒng),可以開展查詢、分析、統(tǒng)計、報表等高級應用。大數(shù)據(jù)的管理、安全和備份恢復框架幫助進行大數(shù)據(jù)的治理和保護。
該框架幾乎涵蓋了大數(shù)據(jù)技術的所有環(huán)節(jié),值得指出的是,通過該訪問框架不僅可以實現(xiàn)對分布式文件存儲系統(tǒng)的訪問,而且通過大數(shù)據(jù)連接器和開源數(shù)據(jù)傳遞工具Sqoop可以實現(xiàn)對傳統(tǒng)數(shù)據(jù)倉庫的訪問。
大數(shù)據(jù)的處理流程可以定義為在合適工具的輔助下,對廣泛異構(gòu)的數(shù)據(jù)源進行抽取和集成,按照統(tǒng)一的標準對結(jié)果進行存儲,利用恰當?shù)臄?shù)據(jù)分析技術對存儲的數(shù)據(jù)進行分析,達到從中提取出有價值的知識的目的,并用合適的方式將結(jié)果展現(xiàn)給終端用戶。
對電力企業(yè)來講,電力大數(shù)據(jù)的基本處理流程與傳統(tǒng)數(shù)據(jù)處理流程并無太大差異,主要區(qū)別在于:電力大數(shù)據(jù)需要處理大量、非結(jié)構(gòu)的數(shù)據(jù),所以在各個環(huán)節(jié)都可以采用MapReduce等方式進行并行處理。
電力系統(tǒng)是一種高維非線性的復雜系統(tǒng),其內(nèi)部的數(shù)據(jù)流包含電力流、信息流、業(yè)務流、故障流、氣象流等不同的數(shù)據(jù)流向。
對這些電力系統(tǒng)的子信息源而言,一方面可以單獨應用大數(shù)據(jù)技術,提升其產(chǎn)業(yè)價值,例如電力設備在線監(jiān)測系統(tǒng)本身就是一個大數(shù)據(jù)系統(tǒng),另一方面可以融合不同的子信息源,在更高的層面上構(gòu)件大數(shù)據(jù)平臺,例如融合電能計量系統(tǒng)、SCADA系統(tǒng)、MIS系統(tǒng)、負荷控制系統(tǒng),可以構(gòu)建基于大數(shù)據(jù)平臺的網(wǎng)損分析系統(tǒng),實現(xiàn)網(wǎng)損的自動統(tǒng)計與分析。
基于該網(wǎng)損分析大數(shù)據(jù)平臺,還可開展基于自動網(wǎng)損統(tǒng)計的用戶竊電行為挖掘,實現(xiàn)更深層次的應用。
3 電力大數(shù)據(jù)關鍵技術
3.1 電力大數(shù)據(jù)的集成管理技術
電力企業(yè)數(shù)據(jù)集成管理技術是合并來自2個或者多個應用系統(tǒng)的數(shù)據(jù),創(chuàng)建一個具有更多功能的企業(yè)應用的過程。從集成的角度來說,就是把不同來源、格式、特點、性質(zhì)的數(shù)據(jù)在邏輯上或者存儲介質(zhì)上有機地集中,為系統(tǒng)存儲一系列面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,從而為系統(tǒng)提供全面的數(shù)據(jù)共享。電力企業(yè)集成管理技術就是為解決電力企業(yè)內(nèi)部各系統(tǒng)間的數(shù)據(jù)冗余和信息孤島而產(chǎn)生的。
電力大數(shù)據(jù)的數(shù)據(jù)集成管理技術,包含關系型和非關系型數(shù)據(jù)庫技術、數(shù)據(jù)融合和集成技術、數(shù)據(jù)抽取技術、過濾技術和數(shù)據(jù)清洗等。大數(shù)據(jù)的一個重要特點就是多樣性,這就意味著數(shù)據(jù)來源極其廣泛,數(shù)據(jù)類型極為繁雜,這種復雜的數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來極大的挑戰(zhàn),要想處理大數(shù)據(jù),首先必須對數(shù)據(jù)源的數(shù)據(jù)進行抽取和集成,從中提取出實體和關系,經(jīng)過關聯(lián)和聚合之后采用統(tǒng)一的結(jié)構(gòu)來存儲這些數(shù)據(jù),在數(shù)據(jù)集成和提取時需要對數(shù)據(jù)進行清洗,保證數(shù)據(jù)質(zhì)量及可靠性。
大數(shù)據(jù)存儲管理中一個重要的技術是NoSQL數(shù)據(jù)庫技術,它采用分布式數(shù)據(jù)存儲方式,去掉了關系型數(shù)據(jù)庫的關系型特性,數(shù)據(jù)存儲被簡化且更加靈活,具有良好的可擴展性,解決了海量數(shù)據(jù)的存儲難題。有代表性的NoSQL 數(shù)據(jù)庫技術有Google的BigTable和Amazon的Dynamo等。
3.2 電力大數(shù)據(jù)的數(shù)據(jù)分析技術
大數(shù)據(jù)技術的根本驅(qū)動力是將信號轉(zhuǎn)化為數(shù)據(jù),將數(shù)據(jù)分析為信息,將信息提煉為知識,以知識促成決策和行動。借助電力大數(shù)據(jù)的分析技術可以從電力系統(tǒng)的海量數(shù)據(jù)中找出潛在的模態(tài)與規(guī)律,為決策人員提供決策支持。
麥肯錫認為可用于大數(shù)據(jù)分析的關鍵技術源于統(tǒng)計學和計算機科學等學科,包含關聯(lián)分析、機器學習、數(shù)據(jù)挖掘、模式識別、神經(jīng)網(wǎng)絡、時間序列預測模型、遺傳算法等多種不同的方法。
大數(shù)據(jù)研究不同于傳統(tǒng)的邏輯推理研究,是對巨大數(shù)量的數(shù)據(jù)做統(tǒng)計性的搜索、分類、比較、聚類等的分析和歸納,因此繼承了統(tǒng)計科學的一些特點,如統(tǒng)計學關注的數(shù)據(jù)相關性或稱關聯(lián)性,所謂“相關性”是指2個或2個以上變量的取值之間存在某種規(guī)律性[7]!跋嚓P分析”的目的是找出數(shù)據(jù)集里隱藏的關系網(wǎng),一般用支持度、可信度、興趣度等參數(shù)反映相關性。
牛津大學網(wǎng)絡學院教授維克多在他的著作《大數(shù)據(jù)時代》中指出:在大數(shù)據(jù)時代,相關關系分析法將大放異彩,通過找到一個良好現(xiàn)象的關聯(lián)物,相關關系分析可以捕獲現(xiàn)在和預測未來。大數(shù)據(jù)相關關系分析法,建立在海量樣本的基礎上,不采用隨機分析法這樣的捷徑,而采用分析所有數(shù)據(jù)的方法;大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效,其結(jié)果更快、更準確而且不易受到干擾,因此他指出建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。
大數(shù)據(jù)這種不注重因果關系側(cè)重于相關關系的分析方法,帶來了科學研究思維方式的重大轉(zhuǎn)變,已故圖靈獎得主吉姆˙格雷提出的數(shù)據(jù)密集型科研“第四范式”,將大數(shù)據(jù)科研從前3 種范式(理論科學、計算科學、實驗科學)中分離出來,單獨作為一種科研范式,正是因為其研究方式不同于基于數(shù)學模型的傳統(tǒng)研究方式。
電力大數(shù)據(jù)分析技術,從根本上講,屬于傳統(tǒng)數(shù)據(jù)挖掘技術在海量數(shù)據(jù)挖掘下的新發(fā)展,但由于大數(shù)據(jù)海量、高速增長、多樣性的特點,并且不僅包含結(jié)構(gòu)化數(shù)據(jù),還含半結(jié)構(gòu)化和非機構(gòu)化數(shù)據(jù),因此傳統(tǒng)的很多處理小數(shù)據(jù)的數(shù)據(jù)挖掘方法已經(jīng)不再實用。
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘與機器學習算法,可以從3個方面著手:1)從大數(shù)據(jù)的治理與抽樣、特征選擇的角度入手,將大數(shù)據(jù)小數(shù)據(jù)化;2)開展大數(shù)據(jù)下的聚類、分類算法研究,例如基于共軛度的最小二乘支持向量機(least squares support vector machine,LS-SVM)],隨機可擴展FuzzyC-Means (FCM)等;3)開展大數(shù)據(jù)的并行算法,將傳統(tǒng)的數(shù)據(jù)挖掘方法通過并行化,應用到大數(shù)據(jù)的知識挖掘中,例如基于MapReduce的機器學習與知識挖掘。
3.3 電力大數(shù)據(jù)的數(shù)據(jù)處理技術
電力大數(shù)據(jù)的數(shù)據(jù)處理技術包括分布式計算技術,內(nèi)存計算技術,流處理技術等。分布式計算技術是為了解決大規(guī)模數(shù)據(jù)的分布式存儲與處理。內(nèi)存計算技術是為了解決數(shù)據(jù)的高效讀取和處理在線的實時計算。流處理技術則是為了處理實時到達的、速度和規(guī)模不受控制的數(shù)據(jù)。
分布式計算是一種新的計算方式,研究如何將一個需要強大計算能力才能解決的問題分解為許多小的部分,然后再將這些部分分給多個計算機處理,最后把結(jié)果綜合起來得到最終結(jié)果。
分布式計算的一個典型代表是Google公司提出的MapReduce編程模型,該模型先將待處理的數(shù)據(jù)進行分塊,交給不同的Map任務區(qū)處理,并按鍵值存儲到本地硬盤,再用Reduce任務按照鍵值將結(jié)果匯總并輸出最終結(jié)果。分布式技術適用于電力系統(tǒng)信息采集領域的大規(guī)模分散數(shù)據(jù)源。
內(nèi)存計算技術是將數(shù)據(jù)全部放在內(nèi)層中進行操作的計算技術,該技術克服了對磁盤讀寫操作時的大量時間消耗,計算速度得到幾個數(shù)量級的大幅提升。內(nèi)層計算技術伴隨著大數(shù)據(jù)浪潮的來臨和內(nèi)存價格的下降得到快速的發(fā)展和廣泛的應用,EMC、甲骨文、SAT都推出了內(nèi)存計算的解決方案,將客戶以前需要以天作為時間計算單位的業(yè)務降低為以秒作為時間計算單位,解決了大數(shù)據(jù)實時分析和知識挖掘的難題。
流處理的處理模型是將源源不斷的數(shù)據(jù)組視為流,當新的數(shù)據(jù)到來時就立即處理并返回結(jié)果,其基本理念是數(shù)據(jù)的價值會隨著時間的流逝而不斷減少,因此盡可能快地對最新的數(shù)據(jù)做出分析并給出結(jié)果,其應用場景主要有網(wǎng)頁點擊的實時統(tǒng)計、傳感器網(wǎng)絡、金融中的高頻交易等[8]。
隨著電力事業(yè)的發(fā)展,電力系統(tǒng)數(shù)據(jù)量不斷增長,對實時性的要求也越來越高,將數(shù)據(jù)流技術應用于電力系統(tǒng)可以為決策者提供即時依據(jù),滿足實時在線分析需求。
3.4 電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術
電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術包括可視化技術、空間信息流展示技術、歷史流展示技術等?梢暬夹g、空間信息流展示技術、歷史流展示技術從3個不同的方面詮釋了電力大數(shù)據(jù)展現(xiàn)技術的豐富內(nèi)涵。借助電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術可幫助管理人員更直觀、準確地理解電力系統(tǒng)數(shù)據(jù)表達的意義,了解電力系統(tǒng)的運行狀態(tài)。
可視化技術廣泛應用于電網(wǎng)狀態(tài)的實時監(jiān)控,顯著提高了電力系統(tǒng)的自動化水平。未來電力系統(tǒng)可視化還可結(jié)合復雜網(wǎng)絡中的相關理論在電網(wǎng)自動分層分區(qū)、自動布點等方面展開深入研究,發(fā)掘電網(wǎng)更深層次的規(guī)律和聯(lián)系。
空間信息流展示技術主要體現(xiàn)在電網(wǎng)參數(shù)與已有地理信息系統(tǒng)的結(jié)合上,包含變電站三維展示、虛擬現(xiàn)實等技術。將電力配電設備管理與地理信息系統(tǒng)緊密結(jié)合起來,有利于電網(wǎng)管理人員直觀地了解設備情況,從而為其決策提供最新的地理信息。在變電站工程設計中用空間信息流展示技術可以節(jié)約時間、資源、成本,為電力企業(yè)帶來巨大的效益。
歷史流展示技術體現(xiàn)在對電網(wǎng)歷史數(shù)據(jù)的管理與展示上。在電力系統(tǒng)中,深層次的應用分析往往以歷史數(shù)據(jù)為基礎。對生產(chǎn)現(xiàn)場的實時監(jiān)測數(shù)據(jù)、電網(wǎng)的規(guī)劃數(shù)據(jù)和負荷預測數(shù)據(jù),通過歷史流展示技術,可以繪制出數(shù)據(jù)的發(fā)展趨勢并預測出未來的數(shù)據(jù)走勢;通過歷史流回放展示技術,可以模擬歷史重大事件發(fā)生、演變,挖掘歷史事件潛在的知識與規(guī)律。
4 大數(shù)據(jù)在智能電網(wǎng)中的應用
電力大數(shù)據(jù)的應用場合涵蓋發(fā)、輸、變、配、用、調(diào)等電力行業(yè)的各個環(huán)節(jié),在風電場選址、降低網(wǎng)損、風電并網(wǎng)、電網(wǎng)安全監(jiān)測、大災難預警、電力企業(yè)精細化運營、電力設備狀態(tài)監(jiān)測等領域有非常強的可實現(xiàn)性。
5 結(jié)論與展望
本文探討了大數(shù)據(jù)、云計算、智能電網(wǎng)三者之間的相互關系,并給出電力大數(shù)據(jù)的總體可執(zhí)行框架,對電力企業(yè)大數(shù)據(jù)平臺的搭建具有參考價值。
本文闡述了電力大數(shù)據(jù)平臺中4個核心的關鍵技術,即集成管理技術、分析技術、處理技術、展現(xiàn)技術。大數(shù)據(jù)的集成管理技術應該考慮關系型和非關系型數(shù)據(jù)庫技術的綜合應用,并重點考慮NoSQL數(shù)據(jù)庫技術;大數(shù)據(jù)的分析技術應從大數(shù)據(jù)的治理與抽樣、大數(shù)據(jù)特征選擇、大數(shù)據(jù)小數(shù)據(jù)化、大數(shù)據(jù)的分類算法、大數(shù)據(jù)挖掘并行化等方面開展研究;大數(shù)據(jù)的處理技術應根據(jù)具體的應用需求考慮分布式計算、內(nèi)存計算、流處理等技術;電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術可考慮可視化技術、空間信息流展示技術、歷史流展示技術等。
大數(shù)據(jù)技術在商業(yè)領域已經(jīng)獲得較為廣泛的應用并創(chuàng)造出巨大的商業(yè)價值,但是在電力系統(tǒng)中的應用才剛剛起步,因此結(jié)合大數(shù)據(jù)的技術優(yōu)勢和電力系統(tǒng)的應用需求,發(fā)揮電力大數(shù)據(jù)的價值,將為智能電網(wǎng)的建設帶來新的發(fā)展契機。
電力企業(yè)應該牢牢抓住這個契機,從數(shù)據(jù)政策、人才培養(yǎng)、關鍵技術研發(fā)等層面,全面促成電力大數(shù)據(jù)技術的發(fā)展。
保定市四北電子有限公司具有卓越的產(chǎn)品性能、優(yōu)良的品質(zhì)、高可靠的電源設計,并提供定制開關電源服務,F(xiàn)已形成幾大系列產(chǎn)品:開關電源系列、逆變電源系列、充電電源系列、備用電源系列等產(chǎn)品。提供AC/DC、DC/DC、DC/AC基板式、模塊式、嵌入式等各種形式專用電源。
主要電源類別有:電力自動化設備專用電源;通訊領域?qū)S秒娫;電力測試儀器專用電源;機車控制系統(tǒng)電源:高壓激光電源;浮充電電源;UPS電源;伺服式交流穩(wěn)壓電源;ZDD系列20W∽3KW逆變電源。http://www.szdaixie.com
【上一個】 開關電源廠家簡說逆變器對于提升電網(wǎng)品質(zhì)的幫助 | 【下一個】 四北電子公司介紹如何設計高效小型化開關電源 |
^ 開關電源廠家口若懸河講面向智能電網(wǎng)應用的電力大數(shù)據(jù)關鍵技術 |