導讀:數(shù)據(jù)治理的價值,指對企業(yè)和整個數(shù)據(jù)管理的價值。所有市場都要求數(shù)據(jù)治理變得比以往任何時候都靈活易變,以適應更多需求的出現(xiàn)。很多企業(yè)組織正在認識到,嘗試完全預先確定每一種可能的數(shù)據(jù)治理突發(fā)事件并為此做好相應準備是很困難的。
數(shù)據(jù)治理的價值,指對企業(yè)和整個數(shù)據(jù)管理的價值。所有市場都要求數(shù)據(jù)治理變得比以往任何時候都靈活易變,以適應更多需求的出現(xiàn)。很多企業(yè)組織正在認識到,嘗試完全預先確定每一種可能的數(shù)據(jù)治理突發(fā)事件并為此做好相應準備是很困難的。
2023 Trends in Data Governance
數(shù)據(jù)治理的價值,指對企業(yè)和整個數(shù)據(jù)管理的價值。2023年,將體現(xiàn)在塑造該學科的兩個最明顯的趨勢中。
首先,這個術語已經(jīng)被專門從事訪問管理、數(shù)據(jù)控制和企業(yè)安全內(nèi)部方面的供應商所使用。這些供應商專注于法規(guī)遵從性、數(shù)據(jù)隱私和數(shù)據(jù)保護——在如今高度監(jiān)管的環(huán)境中,這些已經(jīng)迅速成為決定當代企業(yè)成敗的因素。
其次,這個趨勢體現(xiàn)出數(shù)據(jù)治理對越來越多的環(huán)境、用例和市場條件的實時適用性,所有市場都要求數(shù)據(jù)治理變得比以往任何時候都靈活易變,以適應更多需求的出現(xiàn)。很多企業(yè)組織正在認識到,嘗試完全預先確定每一種可能的數(shù)據(jù)治理突發(fā)事件并為此做好相應準備是很困難的。
相反,他們現(xiàn)在試圖調(diào)整數(shù)據(jù)治理結構,以便在發(fā)生這種情況時能夠動態(tài)地進行調(diào)整。
TopQuadrant首席技術官Ralph Hodgson表示:“知道可能發(fā)生什么(通常數(shù)據(jù)治理就是要表達這一點)、已經(jīng)發(fā)生了什么和正在發(fā)生什么是有區(qū)別的。在數(shù)據(jù)治理的操作方面,正在發(fā)生的是一個非常難以解決的問題。如果面對一家企業(yè)的【數(shù)字孿生應用】,那就是‘正在發(fā)生的事情’數(shù)據(jù)治理理念的未來?!?/p>
盡管數(shù)字孿生還沒有普及到整個數(shù)據(jù)領域,但是數(shù)據(jù)治理的許多基本方面——當通過實時訪問控制和情景適應性的鏡頭應用時——可以模擬它們詳細描述當前發(fā)生的事情的能力。
這只是一個從知識到控制和利用知識以實現(xiàn)治理目標的邏輯過程。
管理元數(shù)據(jù)
元數(shù)據(jù)管理很可能一直是數(shù)據(jù)治理的核心。組織可以從許多旨在優(yōu)化這一任務的工具中進行選擇。目前有大量的數(shù)據(jù)目錄、主數(shù)據(jù)管理工具,以及Privacera首席執(zhí)行官所稱的“敏感數(shù)據(jù)目錄”,可以通過各種元數(shù)據(jù)模型實現(xiàn)數(shù)據(jù)發(fā)現(xiàn)和分類的自動化。根據(jù)Hodgson的說法,有六種基本形式的元數(shù)據(jù)與數(shù)據(jù)治理的突出領域接壤,包括:
數(shù)據(jù)表達:該維度涉及“數(shù)據(jù)如何表達;什么數(shù)據(jù)類型;什么數(shù)據(jù)表達式;它是可以量化的嗎?它是否有測量單位等等。
數(shù)據(jù)質量:高質量的數(shù)據(jù)對于信任數(shù)據(jù)和鼓勵業(yè)務采用這些數(shù)據(jù)是不可或缺的。
用法:該區(qū)域處理數(shù)據(jù)的重要性、數(shù)據(jù)安全性和數(shù)據(jù)機密性。
數(shù)據(jù)管理:數(shù)據(jù)管理需要“所有權、指標和可訪問性”。
法規(guī)遵從性:關于法規(guī)遵從性的元數(shù)據(jù)通常為策略和標準提供信息。
數(shù)據(jù)來源:數(shù)據(jù)沿襲或數(shù)據(jù)來源表示數(shù)據(jù)的起源和企業(yè)旅程。
根據(jù)Gartner的說法,元數(shù)據(jù)已經(jīng)從被動變?yōu)橹鲃樱瑸閷崟r用例提供信息,比如數(shù)據(jù)結構的數(shù)據(jù)集成。因此,所描述的元數(shù)據(jù)(以及伴隨的數(shù)據(jù)治理結構)關鍵的方面是,具備表達事物之間關系的共同需求,清楚地了解這些數(shù)據(jù)治理領域中的元素如何相互關聯(lián),使組織能夠調(diào)整它們以滿足新的需求、數(shù)據(jù)源或用例。
數(shù)據(jù)模型
Hodgson所說的“元關系”是動態(tài)修改數(shù)據(jù)治理組件以滿足新興環(huán)境和業(yè)務條件的必要條件。概念性數(shù)據(jù)模型包括這些關系、它們的定義和消除它們歧義的語義(如果必要的話)——在部門或應用程序之間。這樣的數(shù)據(jù)模型有助于與數(shù)據(jù)治理相關的一切,從呈現(xiàn)數(shù)據(jù)訪問控制到促進生命周期管理必需品(如保留策略)。定義良好的概念數(shù)據(jù)模型可能是調(diào)整數(shù)據(jù)治理協(xié)議以滿足不斷出現(xiàn)的情況的起點。為此,這樣的模型由特定的領域(模型是關于什么的)和規(guī)程組成。
其他維度包括企業(yè)對主題的觀點、模型的專一程度、它的方面和時間信息。用必需的數(shù)據(jù)標識符、術語系統(tǒng)和模式指定模型的這些元素,可以很容易地將它們組合起來進行部門間的分析,在源系統(tǒng)、客戶360、數(shù)據(jù)隱私需求等之間進行分析。TopQuadrant首席執(zhí)行官尼米特?梅塔闡述了一個用例,在這個用例中,機構致力于野火預防,每個機構都有自己的術語。當面對那么多不同的宗教,怎么讓他們都說同一種語言?圖表允許你以一種標準驅動的方式,創(chuàng)建一個元模型,并使那些聯(lián)邦語言學保持它們的位置?!?/p>
分布式數(shù)據(jù)管理
數(shù)據(jù)環(huán)境的分布及其對數(shù)據(jù)管理的影響將繼續(xù)是明年數(shù)據(jù)治理領域的首要挑戰(zhàn)。除了云計算和多云計算的日益流行之外,數(shù)據(jù)結構和數(shù)據(jù)網(wǎng)格等體系結構也加劇了這個問題。當然,它影響數(shù)據(jù)治理的所有方面,從生命周期管理到元數(shù)據(jù)管理。然而,正如Ganesan正確指出的那樣,“這就是數(shù)據(jù)治理的作用所在:在公司內(nèi)部。他們是如何看待和對待這些數(shù)據(jù)的?”為此,對專門用于擴展交付受治理數(shù)據(jù)訪問能力的解決方案的投資——同時減少跨源的策略實施措施的數(shù)量,不太可能在新的一年里減少。
Ganesan指出,實現(xiàn)這些成果的方式多種多樣,包括“提供一個可以管理所有平臺的窗口”。策略減少是通過基于屬性的訪問控制(ABAC)及其相應的基于目的的訪問控制(PBAC)實現(xiàn)的,兩者對于維護流暢、響應性強的數(shù)據(jù)治理都有影響。根據(jù)Immuta首席技術官Steve Touw的說法,“基于數(shù)據(jù)標簽標記數(shù)據(jù)和推送策略并不是ABAC。這是ABAC的一個組成部分。ABAC的真正威力在于使訪問成為動態(tài)的運行時決策,而不是預先計算的、基于角色的決策。”PBAC利用這一優(yōu)勢,僅為特定目的(例如處理某個報告)授予訪問權。
數(shù)據(jù)隱私和法規(guī)遵從性
ABAC和PBAC都是實現(xiàn)法規(guī)合規(guī)性的基礎,特別是在橫向數(shù)據(jù)隱私要求方面,并向監(jiān)管機構展示這些事實。“你不僅得到了控制和屏蔽,你還得到了法律監(jiān)督,讓你的用戶同意他們只會為特定目的使用這些東西,并在他們訪問數(shù)據(jù)時按照該目的行事,”Steve Touw表示。
數(shù)據(jù)來源支持這個用例和其他此類用例的法規(guī)遵從性演示,它也普遍適用于數(shù)據(jù)治理的許多方面。生成日志文件,記錄誰訪問了哪些數(shù)據(jù)、何時訪問了哪些數(shù)據(jù)、使用PBAC和其他方法訪問了哪些數(shù)據(jù)、目的是什么。也許,應用于法規(guī)遵從性和治理的其他維度的數(shù)據(jù)譜系的更廣泛的分支與它所交付的上下文有關——這有助于告知修改治理概念以滿足不斷變化的環(huán)境的能力。
數(shù)據(jù)的質量
數(shù)據(jù)領域的分布越來越廣,加上可用的大量非結構化數(shù)據(jù)的種類越來越多,使得數(shù)據(jù)質量成為良好治理數(shù)據(jù)的先決條件。Ganesan表示:治理部分圍繞元數(shù)據(jù)、質量和訪問部分,以減少用戶查找和使用數(shù)據(jù)的阻力,盡管數(shù)據(jù)質量有很多指標,但最核心的指標不可避免地與“完整性、正確性、清晰度、一致性等諸如此類的指標”有關。
與統(tǒng)計和非統(tǒng)計人工智能用于發(fā)現(xiàn)和分類數(shù)據(jù)的大量自動化類似,也有這樣的機制來幫助確定數(shù)據(jù)質量存在缺陷的領域,并對其進行糾正。模糊匹配和精確匹配也可以提供這些好處。因此,這種現(xiàn)代數(shù)據(jù)質量機制“在我們可以建議映射到詞匯表的地方使用機器學習,然后以詞匯表的形式,例如,可以表達一致性的規(guī)則,”霍奇森說。
態(tài)勢感知,實時響應
正如Hodgson之前指出的,理想的數(shù)據(jù)治理是業(yè)務及其數(shù)據(jù)流程的實時模型,以確保后者的長期價值,同時豐富前者。這種范式隱含著修改數(shù)據(jù)模型、權限、術語甚至治理策略的能力(如果需要的話),以一種內(nèi)聚的方式提供業(yè)務價值,同時降低風險。動態(tài)訪問控制功能、活動元數(shù)據(jù)和流動的分布式數(shù)據(jù)管理可以促進這些收獲。
實現(xiàn)這種可變形式的數(shù)據(jù)治理比人們想象的要快得多。