你對于元數(shù)據(jù)管理有興趣嘛?元數(shù)據(jù)管理被越來越多的企業(yè)所需求,元數(shù)據(jù)是通過企業(yè)中的用戶和技術(shù)用戶溝通得來的。下面是小編帶來的DAMA元數(shù)據(jù)管理活動學習心得,有興趣的可以看看。
理解元數(shù)據(jù)需求
元數(shù)據(jù)管理戰(zhàn)略必須反映對企業(yè)元數(shù)據(jù)需求的理解,收集需求的目的包括:
確認企業(yè)需要元數(shù)據(jù)管理環(huán)境
設(shè)定范圍和優(yōu)先級
教育和溝通
指導(dǎo)工具評估和實施
指導(dǎo)元數(shù)據(jù)建模
指導(dǎo)建立元數(shù)據(jù)內(nèi)部標準
指導(dǎo)提供基于元數(shù)據(jù)的服務(wù)
元數(shù)據(jù)需求是通過與企業(yè)中的業(yè)務(wù)用戶和技術(shù)用戶進行溝通而獲得的,并且對企業(yè)中特定人員的崗位角色、職責、挑戰(zhàn)等進行分析可提煉出需求,而不是簡單地詢問用戶的元數(shù)據(jù)需求
業(yè)務(wù)用戶對來自于操作型系統(tǒng)和分析系統(tǒng)的信息需要加深理解,來自企業(yè)數(shù)據(jù)倉庫、分析應(yīng)用和操作型系統(tǒng)需要產(chǎn)生讓業(yè)務(wù)用戶可以高度信任的信息。此外還需要根據(jù)角色定制的信息提供方法,如報表、查詢、推送、OLAP、儀表盤等,同時還要附帶高質(zhì)量的文檔和信息的上下文背景
業(yè)務(wù)用戶需要理解元數(shù)據(jù)管理的意圖和目的,為了給用戶提供有意義的業(yè)務(wù)需求,需要讓他們學習數(shù)據(jù)與元數(shù)據(jù)的區(qū)別,如何讓業(yè)務(wù)用戶的關(guān)注點限定在元數(shù)據(jù)需求而非其他的數(shù)據(jù)需求則是一個挑戰(zhàn)
另一個對元數(shù)據(jù)管理的成功至關(guān)重要的因素是建立數(shù)據(jù)治理組織,數(shù)據(jù)治理委員會是企業(yè)數(shù)據(jù)和元數(shù)據(jù)管理的方向和需求的治理主體
技術(shù)用戶宏觀的技術(shù)需求主題包括:
每日數(shù)據(jù)處理流量-大小和處理時間
現(xiàn)有元數(shù)據(jù)
已知和未知數(shù)據(jù)源
目標
轉(zhuǎn)換
物理與邏輯架構(gòu)流程
非標準元數(shù)據(jù)需求
技術(shù)用戶包括數(shù)據(jù)庫管理員(DBA)、元數(shù)據(jù)專家、架構(gòu)師、IT支持人員和開發(fā)人員。通常這些人員是企業(yè)信息資產(chǎn)的監(jiān)管人,他們必須完整地理解數(shù)據(jù)的技術(shù)實現(xiàn),此外他們必須對數(shù)據(jù)的業(yè)務(wù)上下文背景有足夠程度的理解,以便業(yè)務(wù)用戶所提出的需求提供必要的支持
定義元數(shù)據(jù)架構(gòu)
元數(shù)據(jù)管理方案或環(huán)境包含如下架構(gòu)層次
元數(shù)據(jù)創(chuàng)建/獲取
元數(shù)據(jù)整合
一個或多個元數(shù)據(jù)存儲庫
元數(shù)據(jù)交付
元數(shù)據(jù)應(yīng)用和元數(shù)據(jù)管理/控制
元數(shù)據(jù)管理系統(tǒng)必須具備從多種元數(shù)據(jù)來源抽取元數(shù)據(jù)的能力,所設(shè)計的元數(shù)據(jù)架構(gòu)需要能掃描各種元數(shù)據(jù)來源并定期更新元數(shù)據(jù)存儲庫,且系統(tǒng)必須支持多用戶組進行元數(shù)據(jù)手工更新、請求、搜索和查詢
一個受控的元數(shù)據(jù)環(huán)境應(yīng)該為最終用戶屏蔽元數(shù)據(jù)的位置、類型的差異,其架構(gòu)應(yīng)該為用戶提供一個統(tǒng)一的元數(shù)據(jù)存儲庫訪問入口,該入口需要透明地向用戶提供所有相關(guān)元數(shù)據(jù)的資源
公共元數(shù)據(jù)存儲庫通常有3中技術(shù)架構(gòu)方法:集中式、分布式、和混合式
集中式:一個單獨的元數(shù)據(jù)存儲庫,保存來自各個元數(shù)據(jù)來源的最新元數(shù)據(jù)副本,如果企業(yè)高度重視元數(shù)據(jù)存儲庫的統(tǒng)一性和一致性,集中式架構(gòu)是個不錯的選擇
分布式:元數(shù)據(jù)架構(gòu)只維護一個單一訪問點,元數(shù)據(jù)獲取引擎響應(yīng)用戶的需求,從元數(shù)據(jù)來源系統(tǒng)實時獲取元數(shù)據(jù),而不存在永久的元數(shù)據(jù)存儲庫中
混合元數(shù)據(jù)架構(gòu)中元數(shù)據(jù)依然從元數(shù)據(jù)來源系統(tǒng)進入存儲庫,但存儲庫的設(shè)計只考慮用戶增加的元數(shù)據(jù)、高度標準化的元數(shù)據(jù)以及手工獲取的元數(shù)據(jù)。該架構(gòu)的好處是可以實現(xiàn)準時的獲取元數(shù)據(jù),以及提供更完善的元數(shù)據(jù)信息更好地滿足元數(shù)據(jù)用戶的需求;旌霞軜(gòu)減少了IT人工參與和訪問私有系統(tǒng)所需的定制化開發(fā)功能,但混合架構(gòu)不能提升系統(tǒng)的可用性;旌霞軜(gòu)適用于快速變更的元數(shù)據(jù)、需要元數(shù)據(jù)的統(tǒng)一和一致、并且元數(shù)據(jù)量和元數(shù)據(jù)來源數(shù)量都顯著增長的組織
開發(fā)和維護元數(shù)據(jù)標準
元數(shù)據(jù)標準有兩種類型:行業(yè)或共識標準,以及國際標準,總體而言國際標準是制定和執(zhí)行行業(yè)標準的基礎(chǔ)框架
行業(yè)元數(shù)據(jù)標準對于希望實施元數(shù)據(jù)管理、引進和使用適用的元數(shù)據(jù)方案的企業(yè)至關(guān)重要,元數(shù)據(jù)標準與運營交易伙伴進行數(shù)據(jù)交換的領(lǐng)域非常關(guān)鍵,許多公司意識到了與客戶、供應(yīng)商、合作伙伴和監(jiān)管機構(gòu)進行數(shù)據(jù)共享的價值,而信息共享需要公共元數(shù)據(jù)共享的支撐
數(shù)據(jù)整合、關(guān)系型和多維數(shù)據(jù)庫、需求管理、商務(wù)智能報表、數(shù)據(jù)建模和業(yè)務(wù)規(guī)則在內(nèi)的各種技術(shù)都提供了基于XML的元數(shù)據(jù)和數(shù)據(jù)的導(dǎo)入導(dǎo)出能力。對于XML的支持是重要的,但是由于缺少XML Schema標準,所以進行跨產(chǎn)品的元數(shù)據(jù)整合就變成了巨大的挑戰(zhàn)
值得關(guān)注的行業(yè)元數(shù)據(jù)標準包括:
OMG規(guī)范:公共倉儲元模型(CWM)、本體定義元模型(ODM)
萬維網(wǎng)協(xié)會(W3C):資源描述框架(RDF)
都柏林核心規(guī)范:都柏林核心元數(shù)據(jù)(DCMI)
非結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)標準:ISO5964、ISO2788、 ANSI/NISO Z39 ISO 704
空間地理標準
值得關(guān)注的國際元數(shù)據(jù)標準 ISO/IEC 11179
標準化元數(shù)據(jù)的評估指標
為控制環(huán)境中所實施的元數(shù)據(jù)的有效性,應(yīng)對量化評估用戶的理解、企業(yè)的投入以及內(nèi)容覆蓋度和質(zhì)量,評估指標主要應(yīng)采取定量指標,包括:
元數(shù)據(jù)存儲庫的完整性
元數(shù)據(jù)文檔的質(zhì)量
主數(shù)據(jù)服務(wù)數(shù)據(jù)合規(guī)性
管理職責/范圍
元數(shù)據(jù)的使用/引用
元數(shù)據(jù)管理成熟度
元數(shù)據(jù)存儲庫可用性
實現(xiàn)受控的元數(shù)據(jù)環(huán)境
為減小風險并提高被接受的程度,一般通過分布推進的方式實現(xiàn)一個受控的元數(shù)據(jù)環(huán)境:
實施一個試驗項目來理解受管理的元數(shù)據(jù)環(huán)境并進行概念驗證,一個試驗項目應(yīng)具有一定的復(fù)雜度,包括需求評估、戰(zhàn)略制定、技術(shù)評估選型和初始實施周期
在后續(xù)項目中包含路線圖規(guī)劃、人員培訓(xùn)、組織變更和一個后續(xù)發(fā)布計劃,并根據(jù)需要進行評估和再評估工作
創(chuàng)建和維護元數(shù)據(jù)
添加元數(shù)據(jù)等操作可以由授權(quán)用戶和程序以手工方式完成,也可以通過元數(shù)據(jù)創(chuàng)建和更新工具定期掃描和更新存儲庫,最后需要采用審計流程以驗證各項操作活動并報告異常
企業(yè)將元數(shù)據(jù)視為數(shù)據(jù)的索引,因此元數(shù)據(jù)的質(zhì)量至關(guān)重要,低質(zhì)量元數(shù)據(jù)會導(dǎo)致:
重復(fù)的數(shù)據(jù)字典/存儲庫/元數(shù)據(jù)存儲庫
不一致的元數(shù)據(jù)
元數(shù)據(jù)的來源和版本有沖突
對元數(shù)據(jù)系統(tǒng)可靠性的質(zhì)疑
相反高質(zhì)量的元數(shù)據(jù)會帶來:
在企業(yè)層面的信息
對于數(shù)據(jù)資源的價值的一致理解
企業(yè)范圍內(nèi)的元數(shù)據(jù)—即知識
整合元數(shù)據(jù)
元數(shù)據(jù)整合過程是在企業(yè)范圍內(nèi)采集并存儲元數(shù)據(jù)的過程,也包括企業(yè)外部數(shù)據(jù)的元數(shù)據(jù),把元數(shù)據(jù)來源庫中抽取到的元數(shù)據(jù),與相關(guān)的業(yè)務(wù)元數(shù)據(jù)和技術(shù)元數(shù)據(jù)進行整合,最終存儲到元數(shù)據(jù)存儲庫中。元數(shù)據(jù)抽取有多種方式,包括適配程序、掃描程序、橋接程序或者直接訪問數(shù)據(jù)存儲中的元數(shù)據(jù)
元數(shù)據(jù)整合過程中可能存在一些挑戰(zhàn),也可能需要訴諸于數(shù)據(jù)治理流程進行協(xié)調(diào)解決,如對內(nèi)部數(shù)據(jù)集、外部數(shù)據(jù)、非電子形式數(shù)據(jù)進行整合時,可能會出現(xiàn)大量的質(zhì)量和與語義方面的問題
管理元數(shù)據(jù)存儲庫
對存儲庫的控制意味著對元數(shù)據(jù)技術(shù)人員執(zhí)行的元數(shù)據(jù)遷移和存儲庫更新活動進行控制,包括監(jiān)視、響應(yīng)報告、告警、任務(wù)日志和解決存儲庫環(huán)境中的各類問題
元數(shù)據(jù)存儲庫是指存儲元數(shù)據(jù)的物理數(shù)據(jù)庫表,通常采用開放標準的關(guān)系型數(shù)據(jù)庫平臺實現(xiàn)
存儲庫的內(nèi)容在設(shè)計上應(yīng)該是通用的,而不是僅僅反應(yīng)來源系統(tǒng)的數(shù)據(jù)庫設(shè)計,并需要綜合考慮企業(yè)主題域?qū)<业囊庖姡瑫r基于一個易于理解的元數(shù)據(jù)模型。
目錄是一類元數(shù)據(jù)存儲,它將元數(shù)據(jù)限制在特定位置或數(shù)據(jù)來源,應(yīng)在目錄中指明多個來源,元數(shù)據(jù)目錄對于開發(fā)人員、數(shù)據(jù)超級用戶和數(shù)據(jù)分析師尤為有用
術(shù)語表通常提供術(shù)語使用的索引,同義詞可以指導(dǎo)用戶完成相等、層級、關(guān)聯(lián)的關(guān)系結(jié)構(gòu)化選擇,可以為“術(shù)語表內(nèi)”和“術(shù)語表間”的兩個術(shù)語之間指定這些關(guān)系類型
分發(fā)和交付元數(shù)據(jù)
元數(shù)據(jù)交付層負責將元數(shù)據(jù)從存儲庫分發(fā)到最終用戶和其他需要使用元數(shù)據(jù)的應(yīng)用或工具,包括:
元數(shù)據(jù)內(nèi)網(wǎng)
報告、術(shù)語表、其他文檔及網(wǎng)站
數(shù)據(jù)倉庫、數(shù)據(jù)集市和商務(wù)智能工具
建模和軟件開發(fā)
消息傳輸交換
應(yīng)用程序
外部組織接口方案
查詢、報告和分析元數(shù)據(jù)
元數(shù)據(jù)指導(dǎo)我們?nèi)绾问褂脭?shù)據(jù)資產(chǎn),體現(xiàn)在商務(wù)智能(報表和分析)、商業(yè)決策(操作型、運營型、戰(zhàn)略型)以及業(yè)務(wù)語義方面使用
元數(shù)據(jù)指導(dǎo)我們?nèi)绾喂芾頂?shù)據(jù)資產(chǎn):在數(shù)據(jù)治理流程中使用元數(shù)據(jù)進行控制、治理;信息系統(tǒng)實現(xiàn)和傳送過程中使用元數(shù)據(jù)增加、變更、刪除和訪問數(shù)據(jù);數(shù)據(jù)整合通過數(shù)據(jù)的標簽或元數(shù)據(jù)實現(xiàn)數(shù)據(jù)整合,元數(shù)據(jù)控制并審計數(shù)據(jù)、流程和系統(tǒng)整合;一些質(zhì)量提升活動通常是從對元數(shù)據(jù)及元數(shù)據(jù)與數(shù)據(jù)關(guān)系進行檢查開始的
元數(shù)據(jù)存儲庫應(yīng)該具有前端應(yīng)用程序,并支持查詢和獲取功能,從而滿足以上各類數(shù)據(jù)資產(chǎn)管理的需要
綜述
建立元數(shù)據(jù)管理職能的指導(dǎo)原則:
建立和保持一套元數(shù)據(jù)戰(zhàn)略和相關(guān)政策,特別是有關(guān)元數(shù)據(jù)管理和使用方面的清洗目標和目的
需要來自于高層管理者的對企業(yè)元數(shù)據(jù)管理的持續(xù)可靠承諾、資金支持和宣傳方面的支持
從企業(yè)全局著眼規(guī)劃,確?蓴U展性;同時采取迭代和漸進交付的實現(xiàn)方案
評估、采購和安裝元數(shù)據(jù)產(chǎn)品之前,制定元數(shù)據(jù)戰(zhàn)略
建立或采用元數(shù)據(jù)標準,確保在企業(yè)范圍內(nèi)元數(shù)據(jù)的互操作性
確保對內(nèi)部和外部元數(shù)據(jù)的有效獲取
最大化的用戶訪問,因為沒有使用或使用率較低的方案無法體現(xiàn)業(yè)務(wù)價值
理解和溝通元數(shù)據(jù)的必要性和每一類元數(shù)據(jù)的目的;傳播元數(shù)據(jù)的價值,促進業(yè)務(wù)使用
評估元數(shù)據(jù)內(nèi)容和使用情況
采用 XML、消息和WEB服務(wù)等技術(shù)手段
建立數(shù)據(jù)監(jiān)管制度,并保持業(yè)務(wù)人員對該制度的參與,賦予元數(shù)據(jù)管理責任
定義操作程序和流程并進行監(jiān)控,確保政策執(zhí)行的正確性
關(guān)注角色、人員、標準、操作程序、培訓(xùn)和評估指標
為項目和后續(xù)管理提供專職的元數(shù)據(jù)專家
認證元數(shù)據(jù)的質(zhì)量
來源:網(wǎng)絡(luò)整理 免責聲明:本文僅限學習分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時刪除。