電子商務(wù)環(huán)境下的
商業(yè)智能系統(tǒng)研究
ON STUDY OF BUSINESS
INTELLIGENCE SYSTEM UNDER E-COMMERCE ENVIRONMENT
劉依
學(xué)院:悉尼工商學(xué)院
專業(yè):信息管理與信息系統(tǒng)
指導(dǎo)教師:邱允生
完成日期:2004年3月20日
電子上午環(huán)境下的商業(yè)智能系統(tǒng)研究 劉依1/5
中文摘要
本文通過回顧商業(yè)智能系統(tǒng)的發(fā)展歷史以及闡述其發(fā)展的現(xiàn)狀并且結(jié)合利用一些基本的數(shù)據(jù)統(tǒng)計(jì)方法統(tǒng)計(jì)出商業(yè)智能系統(tǒng)在我國(guó)的研究的現(xiàn)狀,確立了本文主題的前沿性和急迫性。隨后通過辨析一些文獻(xiàn)中對(duì)于商業(yè)智能系統(tǒng)的經(jīng)典定義結(jié)合從目的、對(duì)象、實(shí)現(xiàn)過程和核心四個(gè)方面的理解提出一個(gè)基本的理論定義。再將數(shù)據(jù)在系統(tǒng)中流動(dòng)的過程劃分成資料收集階段、數(shù)據(jù)管理階段、數(shù)據(jù)分析階段和數(shù)據(jù)應(yīng)用階段,提出一個(gè)商業(yè)智能的初始化模型及其核心要素分析。
之后,就已經(jīng)提出的模型,從商業(yè)數(shù)據(jù)、商業(yè)數(shù)據(jù)倉庫、商業(yè)智能平臺(tái)、商業(yè)智能工具管理四個(gè)角度對(duì)模型進(jìn)行具體描述和擴(kuò)充。接著,針對(duì)面向Internet的電子商務(wù)環(huán)境下,傳統(tǒng)的商業(yè)智能模型向電子商務(wù)環(huán)境下商業(yè)智能系統(tǒng)的轉(zhuǎn)型特點(diǎn)進(jìn)行更加深入的分析,研究并提出進(jìn)一步在電子商務(wù)環(huán)境下的商業(yè)智能系統(tǒng)的模型。最后,在展望商業(yè)智能系統(tǒng)未來發(fā)展前景的同時(shí)也提出阻礙商業(yè)智能系統(tǒng)發(fā)展的瓶頸及企業(yè)的一些應(yīng)對(duì)措施。
關(guān)鍵詞:商業(yè)智能系統(tǒng) 商業(yè)數(shù)據(jù) 商業(yè)數(shù)據(jù)倉庫 商業(yè)數(shù)據(jù)挖掘 聯(lián)機(jī)分析挖掘 電子商務(wù)
一、資料倉庫的特點(diǎn)分析
根據(jù)數(shù)據(jù)庫專家的定義,我們可以總結(jié)出建立資料倉庫需要滿足的特點(diǎn)有:
(1) 面向主題。它是建立在對(duì)如客戶、產(chǎn)品等一系列已經(jīng)被高度歸類、抽
象的基礎(chǔ)之上的,所有收集來的數(shù)據(jù)將以主題來加以分配。
(2) 集成。指的是因?yàn)槭占瘉淼臄?shù)據(jù)可能五花八門,甚至雜亂無章有自己
的格式、特性。但是經(jīng)過數(shù)據(jù)倉庫的處理,那些看似雜亂的元數(shù)據(jù)將有統(tǒng)一的數(shù)據(jù)格式、統(tǒng)一的數(shù)據(jù)編碼結(jié)構(gòu)、甚至統(tǒng)一的數(shù)據(jù)屬性。
(3) 穩(wěn)定。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作
主要是數(shù)據(jù)查詢,一般情況下并不進(jìn)行修改操作。數(shù)據(jù)倉庫的數(shù)據(jù)反映的是一段時(shí)間內(nèi)歷史數(shù)據(jù)的內(nèi)容,是不同時(shí)點(diǎn)的數(shù)據(jù)庫快照的集合。
(4) 隨時(shí)間不斷變化。指的是數(shù)據(jù)倉庫中的內(nèi)容將隨著時(shí)間的變化,不斷
有新的數(shù)據(jù)加入處理和存儲(chǔ)。
二、商業(yè)數(shù)據(jù)倉庫的設(shè)計(jì)
根據(jù)上述資料倉庫本身的特點(diǎn),將從概念、邏輯和物理三個(gè)層次上分別對(duì)商業(yè)數(shù)據(jù)倉庫進(jìn)行建設(shè)。
概念層。對(duì)概念層來說,企業(yè)主要負(fù)責(zé)分析原有的數(shù)據(jù)庫系統(tǒng)。因?yàn),在企業(yè)原有的數(shù)據(jù)庫中已經(jīng)建立有許多關(guān)于產(chǎn)品或客戶的描述內(nèi)容。企業(yè)要首先分析確定其中的主題域是什么,其中的主鍵是什么,公共鍵是那個(gè),主鍵與主鍵之間的關(guān)系是什么。
商業(yè)數(shù)據(jù)倉庫的設(shè)計(jì)是一個(gè)反復(fù)迭代、逐步求精的螺旋上升的過程。根據(jù)現(xiàn)有的數(shù)據(jù)庫選取其中的幾個(gè)主題開始實(shí)施,不斷的根據(jù)實(shí)際實(shí)施的情況來重新選擇或淘汰不合格的主題,最后達(dá)到完善。
邏輯層。對(duì)邏輯層來說它主要是將概念層的一些設(shè)想轉(zhuǎn)化為邏輯模型。首先,要完成數(shù)據(jù)粒度的劃分。所謂數(shù)據(jù)粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級(jí)別。它的劃分準(zhǔn)確與否事關(guān)數(shù)據(jù)倉庫中的數(shù)據(jù)量和系統(tǒng)所提供的查詢類型。一般將數(shù)據(jù)化分為以下幾個(gè)粒度級(jí)別:詳細(xì)數(shù)據(jù)、輕度數(shù)據(jù)、高度綜合資料和更多級(jí)粒度。粒度越小,細(xì)節(jié)程度越高,級(jí)別也就越低,防止資料的綜合程度越高,粒度越大,級(jí)別就越高。傳統(tǒng)的數(shù)據(jù)庫中大多數(shù)是粒度很低的詳細(xì)資料,這種劃分不利于未來資料分析。而且粒度越是高的數(shù)據(jù),其占據(jù)的存儲(chǔ)空間越小,但對(duì)決策的重要性越大。第二,除了粒度外,還要加入主題的權(quán)重,對(duì)于不同來源的主題賦予不同的在未來分析中所占的比例。第三,要確定數(shù)據(jù)的分割。所謂數(shù)據(jù)的分割,是將邏輯上統(tǒng)一的數(shù)據(jù)分割成較小的可以獨(dú)立管理的單元。數(shù)據(jù)風(fēng)格可以按照數(shù)據(jù)量、數(shù)據(jù)需求分析、數(shù)據(jù)粒度、數(shù)據(jù)權(quán)重或者綜合劃分。第四,確定模式。即根據(jù)上述數(shù)據(jù)劃分的標(biāo)準(zhǔn),進(jìn)行數(shù)據(jù)劃分,確定用多少個(gè)表來實(shí)現(xiàn)。
物理層。所謂物理層就是在實(shí)際物理上明確數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)。其中要考慮的問題是可以將數(shù)據(jù)分為基本數(shù)據(jù)、低潛伏數(shù)據(jù)和歷史數(shù)據(jù)。在基本數(shù)據(jù)中保留一些日常經(jīng)常使用的、不太會(huì)有變化的數(shù)據(jù);低潛伏數(shù)據(jù)主要用于保存外部的數(shù)據(jù)查詢、數(shù)據(jù)操作;歷史數(shù)據(jù)主要是指那些已經(jīng)結(jié)束系統(tǒng)設(shè)定生命周期的數(shù)據(jù)但企業(yè)又有可能在未來要使用其中的某些數(shù)據(jù)。通過不同的安排,提高存儲(chǔ)和索引的質(zhì)量和速度。
圖6展示了基于以上理論的數(shù)據(jù)倉庫生態(tài)系統(tǒng)。
參考文獻(xiàn)
[1] IBM商務(wù)小組,《隨機(jī)應(yīng)變的電子商務(wù)運(yùn)行環(huán)境》,, P32
[2] 劉緒崇等,《基于OLAM的可視化數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)研究》,
[3] 王眾托等,《企業(yè)信息化與管理變革》,中國(guó),中國(guó)人民出版社,2001
[4] 劉依等,《企業(yè)管理信息系統(tǒng)應(yīng)用的戰(zhàn)略問題》,中國(guó)信息導(dǎo)報(bào),2003 No.11, P21
[5] 國(guó)家信息化測(cè)評(píng)中心,《2003年度中國(guó)企業(yè)信息化500強(qiáng)調(diào)查報(bào)告》,tech.sina.com.cn, 2003
[6] 陳敏等,《基于Dm.seogis.com. Marakas, 《21世紀(jì)的決策支持系統(tǒng)》,中國(guó),清華大學(xué)出版社,2002
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請(qǐng)聯(lián)系我們及時(shí)刪除。