數據資產價值評估模型的理論研究與技術實現探討
首席數字官
2019-01-11
文丨李然輝 編輯丨鹿普禾
來源丨數據工匠俱樂部
作者簡介:
李然輝,1982年9月出生,從事IT行業13年以上,其中擁有數據治理及數據資產管理6年從業經驗,獲得數據管理專業認證(CDMP),擁有豐富的數據戰略規劃、數據管理能力成熟度評估、數據治理體系搭建、數據標準管理、企業數據模型設計、數據倉庫構建與數據應用等領域的理論和實踐經驗,先后為政府、能源、金融、互聯網等行業提供服務,近幾年專注于數據資產價值評估領域研究,擁有扎實的理論和實踐經驗。
作為一項公司資產,數據的重要性正日益凸顯。伴隨著數據量和數據種類的不斷增加,數據產生價值的機會也隨之增多。未來數據將成為一個重要的財富創造來源,并且越來越多地被視為一項值得重視的企業資產。數據資產的評估問題,也將成為企業估值的核心問題之一。
數據資產作為一種新型的無形資產,在這方面的研究還十分欠缺,目前還沒有一種完整的數據資產評估體系。筆者基于對數據資產特點的分析,引入層次分析法(AHP)構建指標評價體系,采用專家打分法(Delphi)予以權重和得分的賦值,力求構建一個完整的數據資產評估模型,并實現評估結果的量化分析。
▌一:數據資產的特點
數據資產具有無形資產的屬性,從這個角度出發,我們可以發現數據資產主要有以下特性:無消耗性、增值性、依附性、價值易變性。
無消耗性: 數據資產的每次使用只需要花費很低的成本,不會因為使用頻率的增加而磨損、消耗,與其他傳統無形資產有相似性。
增值性: 企業通過穩定發展,會促使數據資產在原有的基礎上,數據規模和數據維度的不斷積累,整體價值進一步提升。
依附性: 與其他無形資產類似,數據資產不能獨立發揮作用,其發揮作用和效應往往依附于相應的軟件、硬件。
價值易變性: 數據資產時刻受到數據容量、數據時效程度、應用場景等因素的影響,與其他無形資產相比,其價值更易發生變化。
▌二:數據資產價值的構成
數據資產受控于企業主體,依附于有形資產。數據資產的價值受到眾多變量因素的影響,例如數據的質量、數據在不同場景下的應用價值。
數據質量價值
數據只有應用在具體的場景中,才會體現其價值。因此伴隨著不同的場景,同樣的數據會表現不同的價值。數據價值是恒定的,但是又是需要不斷被挖掘的,隨著我們對不同行業的逐漸認知,數據的價值不斷豐富。我們可能難以窮盡數據在所有行業的整體價值,但我們可以就數據在某一具體行業、在當前階段的價值的相對高低予以評估。數據的價值受兩個主要因素的影響:數據質量和數據應用。
數據應用價值
數據價格圍繞數據價值,是市場環境的影響,進行上下波動。數據價格的評估可以基于兩個主要因素:數據成本和數據收益。數據成本主要是從數據擁有方予以考慮,是數據擁有方制定數據價格的主要出發點。處于財務的考慮,數據的價格應該高于數據的成本。數據收益主要是從數據需求方予以考慮,是數據需求方購買數據時愿意付出的最高價格。出于盈利的考慮,數據的價格應該低于數據的收益。
▌三:數據資產價值評估的理論方法
層次分析法(AHP)
層次分析法是美國在20世紀70年代提出的一種將定性和定量分析相結合的多準則決策方法。層次分析模型是把復雜的問題分成若干個組成因素,并按照支配關系分組形成層次結構。然后通過兩兩比較的方式,綜合專家的判斷,確定分析的結果。具體步驟如下:
1)分析各因素的關系,建立遞階層次結構;
2)對同一層次的多個元素,關于上一層次中某一準則的重要性進行兩兩判斷,構建比較判斷矩陣;
3)由判斷矩陣計算比較元素對于該準則的相對權重;
4)計算合成權重;
專家打分法(德爾菲法)
德爾菲法由蘭德公司首次用這種方法用來進行預測,后來該方法被迅速廣泛采用。這是一種將所需解決的問題單獨發送到各個專家手中,征詢意見,然后回收匯總全部專家的意見,并整理出綜合意見。隨后將該綜合意見和預測問題再分別反饋給專家,再次征詢意見,各專家依據綜合意見修改自己原有的意見,然后再匯總。這樣多次反復,逐步取得比較一致的預測結果的決策方法。
1)組成專家小組。按照課題所需要的知識范圍,確定專家;
2)向所有專家提出所要預測的問題及有關要求,由專家做書面答復;
3)各個專家根據他們所收到的材料,提出自己的預測意見;
4)將各位專家第一次判斷意見匯總,列成圖表,進行對比,再分發給各位專家,讓專家比較自己同他人的不同意見,修改自己的意見和判斷;
5)將所有專家的修改意見收集起來,匯總,再次分發給各位專家,以便做第二次修改。這一過程重復進行,直到每一個專家不再改變自己的意見為止;
6)對專家的意見進行綜合處理;
▌四:數據資產價值評估的指標體系
數據資產評估的指標層次
1)數據質量價值評估
數據質量是保證數據應用的基礎,是數據資產價值得以實現的前提。隨著企業擁有數據量的急劇擴大,數據質量問題變得日益突出,數據的質量,將嚴重影響企業數據資產的價值,是決定數據價值高低的重要因素。
數據質量評估的維度包括數據的完整性、正確性、一致性、重復性。數據質量評估能夠對整體或其中部分數據的質量狀況給出一個合理的評估,幫助數據用戶了解數據的質量水平,進而對數據應用水平予以預測,評估企業數據資產的真實價值。
2)數據應用價值評估
數據的價值只有在應用時才得以體現,應用價值是數據資產的核心價值。數據應用價值評估的維度包括場景經濟性、稀缺性、時效性、多維性。數據的應用價值在不同的行業、不同的應用場景下價值的大小不同。在市場環境下,數據的壟斷也是決定數據價值高低的重要因素。在不同應用場景下,對數據的時效性要求也不同,有些場景需要實時性數據,而有些場景需要較長時間周期的歷史性數據。交叉性的多維數據帶來更深刻的洞察,因而價值也更高。
圖片來源:數據工匠俱樂部
數據質量價值
數據質量的評估指標包括完整性、正確性、一致性、重復性。
圖片來源:數據工匠俱樂部
1)完整性(Q1)
指標解讀:描述數據是否存在缺失記錄或缺失字段。數據缺失的情況可能是整個數據記錄缺失,也可能是數據中某個字段信息的記錄缺失。
指標評分方法:完整性=(數據集中所有滿足條件的數據量/數據記錄總數)*100%
圖片來源:數據工匠俱樂部
2)正確性(Q2)
指標解讀:描述數據是否與其對應的客觀實體的特征相一致。任何字段的數據都應該符合特定的數據格式與值域范圍。例如:表示身份證號碼的數據應該為15位或18位;移動電話號碼應該11位;人的年齡應該在0-120歲之間等。
指標評分方法:正確性=(數據集中所有正確的數據量/數據記錄總數)*100%
圖片來源:數據工匠俱樂部
3) 一致性(Q3)
指標解讀:描述同一實體的同一屬性的值在不同數據集中是否一致。在各個獨立的業務系統內部,數據不一致的現象大量存在。例如,“客戶”和“用戶”的意義相同,在相關的多個數據表中,這兩個術語同時存在。
指標評分方法:一致性=(數據集中所有不一致的數據量/數據記錄總數)*100%
圖片來源:數據工匠俱樂部
4)重復性(Q4)
指標解讀:描述數據是否存在重復記錄。現實世界中的同一個主體,在不同的數據源中常常有多個表達,在語法上相同或相似的不同記錄可能會代表現實世界中的同一主體,因而會對同一主體造成重復性記錄。
指標評分方法:重復性=(數據集中所有重復的數據量/數據記錄總數)*100%
圖片來源:數據工匠俱樂部
數據應用價值
數據應用價值包括稀缺性、時效性、多維性、場景價值。
由于數據應用價值的各個維度缺乏具體的數據,也缺乏衡量的標準,更多利用行業專家的經驗,采用專家打分的方法。我們采用本維度的經驗估值與相對應的最大估值的比較,得到相對數值。該數值最大值為10。
更為重要的是,數據的應用價值伴隨的應用場景的不同,數據體現不同的應用價值。同樣的數據集,在A場景的應用價值為10,可能在B場景的應用價值為5.因此,數據應用價值,必須在具體的應用場景下進行評估,并不具備跨行業、多場景通用的應用價值評估標準。
圖片來源:數據工匠俱樂部
圖片來源:數據工匠俱樂部
1)稀缺性
指標解讀:描述數據的供給數量及供給方數量的多寡。在數據源的市場上,當數據供給方局限在很少的數量,或者市場上該類型的數據量稀少,那么相應的數據價值就會較高。
指標評分方法:供給方數量或數據供給豐富程度,與最大供給方數量或數據供給豐富程度相比較。利用行業內的大數據專家經驗,采用專家打分法。
圖片來源:數據工匠俱樂部
2)時效性
指標解讀:描述數據的時間特性對應用的滿足程度。不同類型的應用對數據的時間特性有不同的要求。通常實時性應用中的數據時效性較短,而預測性應用則允許數據有較長的時間。
指標評分方法:該數據集的有效時間與應用所需要的期望有效時間相對比,利用行業內的大數據專家經驗,采用專家打分法。
圖片來源:數據工匠俱樂部
3)多維性
指標解讀:描述數據集的維度多寡程度。伴隨著企業業務的豐富和數據收集數量的增加,會促使數據資產在原有的基礎上,數據維度不斷增加。數據維度與數據資產的價值呈正相關 ,更為復雜的多維度數據蘊含著更大的價值。
指標評分方法:該數據集的維度數量與應用所需要的期望數據維度相對比,利用行業內的大數據專家經驗,采用專家打分法。
圖片來源:數據工匠俱樂部
4)場景經濟性
指標解讀:描述在具體場景下數據集的經濟價值。由于不同行業的規模、數據應用程度等具有差異性,因而不同的場景下的數據集,其價值會相差很大。
指標評分方法:該數據集在某場景下的經濟價值與所有場景中的最大經濟價值相比較,利用行業內的大數據專家經驗,采用專家打分法。
圖片來源:數據工匠俱樂部
▌五:數據資產價值評估指標的權重
構建指標層次結構模型
一級、二級指標
圖片來源:數據工匠俱樂部
計算判斷矩陣及各級權重結果
1)確定判斷定量化標度及含義
對于各個指標的權重,采取兩兩因素比較的專家打分法。在兩個因素相互比較時,需要有定量的標度。我們采用如下的標度方法,其含義如下表所示。
圖片來源:數據工匠俱樂部
2)數據質量判斷矩陣及權重
①構造比較判斷矩陣
根據公司數據專家意見,按照重要程度兩兩比較,構造數據質量的比較判斷矩陣,如下表所示。
圖片來源:數據工匠俱樂部
②計算權重
完成判斷矩陣一致性檢驗,然后計算數據質量評估指標的權重如下表所示。
圖片來源:數據工匠俱樂部
3)數據應用價值判斷矩陣及權重
①構造比較判斷矩陣
根據公司數據專家意見,按照重要程度兩兩比較,構造數據應用價值的比較判斷矩陣,如下表所示。
圖片來源:數據工匠俱樂部
②計算權重
完成判斷矩陣一致性檢驗,然后計算數據應用價值評估指標的權重如下表所示。
圖片來源:數據工匠俱樂部
▌六:數據資產價值評估指標的評分
數據質量得分計算
1)構建數據質量二級指標的評分標準
圖片來源:數據工匠俱樂部
2)二級指標得分
以某數據集為例,假設其數據質量的二級指標得分如下。
圖片來源:數據工匠俱樂部
3)一級指標得分
通過加權計算公式得到數據質量得分:
Sq =(W1*S1+W2*S2+W3*S3+W4*S4)
=(0.32*94.5+0.32*92.05+0.21*92.66+0.15*88.9)
= 92.49
數據應用價值計算得分
假設以某一具體的應用場景為例。
示例:個人位置數據應用于旅游。
1)構建數據應用價值二級指標的評分標準
圖片來源:數據工匠俱樂部
2)二級指標得分
某移動運營商個人位置數據集,應用于旅游景區商家營銷應用的二級指標得分如下。
圖片來源:數據工匠俱樂部
3)一級指標得分
通過加權計算公式得到數據質量得分(滿分100分):
Sa =(W1*S1+W2*S2+W3*S3+W4*S4)
=(0.11*80+0.14*20+0.31*50+0.44*50)
=49.1
數據資產價值評估得分
數據資產價值(S)由數據質量價值(Sq)和數據應用價值(Sa)共同決定,數據資產價值評估得分由二者相乘得到。
S =(Sq * Sa)/100
在上面示例中,數據資產價值評估得分為(百分制):
S =(92.49*49.1)/100= 45.41
▌總 結
筆者提出的數據資產的數據價值評估體系,更多是抽象出數據資產評估的普遍特征和規律,構建一套數據資產評估模型和指標體系。
數據資產作為一種無形資產,本身就存在難以評估的難題。而數據價值評估到目前為止也存在難以量化的瓶頸,因此本數據資產評估的模型與指標體系是在一定約束條件下構建的。
- 觀點
- 制造
- 批發零售
- IT/互聯網
- CEO
- CTO
- CIO
- 戰略
- 運營
- IT
- 區塊鏈
- 大數據
- 云計算
推薦
-
一年一度的中國數字化年會將于11月28日-30日再次攜手成都,為數字化轉型決策者們打造一場不可錯過的年度數字化盛宴!
-
在這個日新月異的變革時代,我們將于11月28日-30日在成都舉辦“2024中國數字化年會”,匯聚行業精英與各界力量,共同探討數字化時代下的轉型策略與路徑。
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
我要評論