1、數(shù)據(jù)挖掘技術(shù)的應(yīng)用及特點
數(shù)據(jù)挖掘技術(shù)是一種新型的技術(shù),在現(xiàn)代數(shù)據(jù)存儲以及測量技術(shù)的迅猛發(fā)展過程中,人們可以進行信息的大量測量并進行存儲。但是,在大量的信息背后卻沒有一種有效的手段和技術(shù)進行直觀的表達和分析。而數(shù)據(jù)挖掘技術(shù)的出現(xiàn),是對目前大數(shù)據(jù)時代的一種應(yīng)急手段,使得有關(guān)計算機數(shù)據(jù)處理技術(shù)得到加快發(fā)展。數(shù)據(jù)挖掘技術(shù)最早是從機器學習的概念中而產(chǎn)生的,在對機器的學習過程中,一般不采用歸納或者較少使用這種方法,這是一種非常機械的操作辦法。而沒有指導性學習的辦法一般不從這些環(huán)境得出反饋,而是通過沒有干預的情況下進行歸納和學習,并建立一種理論模型。數(shù)據(jù)挖掘技術(shù)是屬于例子歸納學習的一種方式,這種從例子中進行歸納學習的方式是介于上述無指導性學習以及較少使用歸納學習這兩種方式之間的一種方式。因此,可以說,數(shù)據(jù)挖掘技術(shù)的特征在出自于機器學習的背景下,與其相比機器主要關(guān)心的是如何才能有效提高機器的學習能力,但數(shù)據(jù)挖掘技術(shù)主要關(guān)心如何才能找到有用、有價值的信息。其第二個特征是,與機器學習特點相比較而言,機器關(guān)心的是小數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)所面臨的對象則是現(xiàn)實中海量規(guī)模的數(shù)據(jù)庫,其作用主要是用來處理一些異常現(xiàn)象,特別是處理殘缺的、有噪音以及維數(shù)很高的數(shù)據(jù)項,甚至是一些不同類型數(shù)據(jù)。以往的數(shù)據(jù)處理方法和現(xiàn)代的數(shù)據(jù)挖掘技術(shù)相比較而言,其不同點是以往的傳統(tǒng)數(shù)據(jù)處理方法前提是把理論作為一種指導數(shù)據(jù)來進行處理,在現(xiàn)代數(shù)據(jù)挖掘技術(shù)的出發(fā)角度不同,主要運用啟發(fā)式的歸納學習進行理論以及假設(shè)來處理的。
2、數(shù)據(jù)挖掘技術(shù)主要步驟
數(shù)據(jù)挖掘技術(shù)首先要建立數(shù)據(jù)倉庫,要根據(jù)實際情況而定,在易出現(xiàn)問題的有關(guān)領(lǐng)域建立有效的數(shù)據(jù)庫。主要是用來把數(shù)據(jù)庫中的所有的存儲數(shù)據(jù)進行分析,而目前的一些數(shù)據(jù)庫雖然可以進行大量的存儲數(shù)據(jù),同時也進行了一系列的技術(shù)發(fā)展。比如,系統(tǒng)中的在線分析處理,主要是為用戶查詢,但是卻沒有查詢結(jié)果的分析能力,而查詢的結(jié)果仍舊由人工進行操作,依賴于對手工方式進行數(shù)據(jù)測試并建模。其次,在數(shù)據(jù)庫中存儲的數(shù)據(jù)選一數(shù)據(jù)集,作為對數(shù)據(jù)挖掘算法原始輸入。此數(shù)據(jù)集所涉及到數(shù)據(jù)的時變性以及統(tǒng)一性等情況。然后,再進行數(shù)據(jù)的預處理,在處理中主要對一些缺損數(shù)據(jù)進行補齊,并消除噪聲,此外還應(yīng)對數(shù)據(jù)進行標準化的處理。隨后,再對數(shù)據(jù)進行降維和變換。如果數(shù)據(jù)的維數(shù)比較高,還應(yīng)找出維分量高的數(shù)據(jù),對高維數(shù)數(shù)據(jù)空間能夠容易轉(zhuǎn)化為檢點的低維數(shù)數(shù)據(jù)空間進行處理。下一步驟就是確定任務(wù),要根據(jù)現(xiàn)實的需要,對數(shù)據(jù)挖掘目標進行確定,并建立預測性的模型、數(shù)據(jù)的摘要等。隨后再決定數(shù)據(jù)挖掘的算法,這一步驟中,主要是對當前的數(shù)據(jù)類型選擇有效的處理方法,此過程非常重要,在所有數(shù)據(jù)挖掘技術(shù)中起到較大作用。隨后再對數(shù)據(jù)挖掘進行具體的處理和結(jié)果檢驗,在處理過程中,要按照不同的目的,選擇不同的算法,是運用決策樹還是分類等的算法,是運用聚類算法還是使用回歸算法,都要認真處理,得出科學的結(jié)論。在數(shù)據(jù)挖掘結(jié)果檢驗時,要注意幾個問題,要充分利用結(jié)論對照其他的信息進行校核,可對圖表等一些直觀的信息和手段進行輔助分析,使結(jié)論能夠更加科學合理。需要注意的是要根據(jù)用戶來決定結(jié)論有用的程度。最后一項步驟是把所得出的結(jié)論進行應(yīng)用到實際,要對數(shù)據(jù)挖掘的結(jié)果進行仔細的校驗,重點是解決好以前的觀點和看法有無差錯,使目前的結(jié)論和原先看法的矛盾有效解除。
3、數(shù)據(jù)挖掘技術(shù)的方法以及在電力營銷系統(tǒng)中的應(yīng)用和發(fā)展
數(shù)控挖掘技術(shù)得到了非常廣泛的應(yīng)用,按照技術(shù)本身的發(fā)展出現(xiàn)了較多方法。例如,建立預測性建模方法,也就是對歷史數(shù)據(jù)進行分析并歸納總結(jié),從而建立成預測性模型。根據(jù)此模型以及當前的其他數(shù)據(jù)進行推斷相關(guān)聯(lián)的數(shù)據(jù)。如果推斷的對象屬于連續(xù)型的變量,那么此類的推斷問題可屬回歸問題。根據(jù)歷史數(shù)據(jù)來進行分析和檢測,再做出科學的架設(shè)和推定。在常用的回歸算法以及非線性變換進行有效的結(jié)合,能夠使許多問題得到解決。電力營銷系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用中關(guān)聯(lián)規(guī)則是最為關(guān)鍵的技術(shù)應(yīng)用之一。這種應(yīng)用可以有效地幫助決策人員進行當前有關(guān)數(shù)據(jù)以及歷史數(shù)據(jù)的規(guī)律分析,最后預測出未來情況。把關(guān)聯(lián)規(guī)則成功引入電力營銷分析,通過FP-Growth算法對電力營銷的有關(guān)數(shù)據(jù)進行關(guān)聯(lián)規(guī)則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關(guān)聯(lián)信息,以便更好地為電力的市場營銷策略提供參謀和決策。對電力營銷系統(tǒng)的應(yīng)用中,時間序列挖掘以及序列挖掘非常經(jīng)典、系統(tǒng),是應(yīng)用最為廣泛的一種預測方法。這種方法的應(yīng)用中,對神經(jīng)網(wǎng)絡(luò)的研究非常之多。因此,在現(xiàn)實中應(yīng)用主要把時間序列挖掘以及神經(jīng)網(wǎng)絡(luò)兩者進行有效地結(jié)合,然后再分析有關(guān)電力營銷數(shù)據(jù)。此外,有關(guān)專家還提出應(yīng)用一種時間窗的序列挖掘算法,這種方式可以進行有效地報警處理,使電力系統(tǒng)中的故障能夠準確的定位并診斷事故。此算法對電力系統(tǒng)的分析和挖掘能力的提高非常有效,還可判定電力系統(tǒng)的運行是否穩(wěn)定,對錯誤模型的分析精度達到一定的精確度。
4、結(jié)語
目前,對數(shù)據(jù)挖掘技術(shù)在整個電力營銷系統(tǒng)中的應(yīng)用還處于較低水平上,其挖掘算法的單一并不能有效地滿足實際決策需要。但是,由于數(shù)據(jù)挖掘技術(shù)對一些潛在的問題預測能力較強,特別是對電力營銷系統(tǒng)中較大規(guī)模的非線性問題,具有較強的處理能力,在未來的發(fā)展中會成為營銷領(lǐng)域中重要的應(yīng)用工具。
來源:網(wǎng)絡(luò)整理 免責聲明:本文僅限學習分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時刪除。