Thoughtworks張晶白:邁向Data Mesh 以全新的數據架構范式,加速創造業務價值
張晶白
2022-01-11
來源:首席數字官
數字經濟時代,數據已經成為繼土地、勞動力、資本、技術之外的第五大生產要素。數據價值的釋放成為各類主體正在實踐中的重要內容。在“2021中國數字化年會”的數據管理論壇上,Thoughtworks中國區數據與智能業務線解決方案總監張晶白帶來《邁向Data Mesh 以全新的數據架構范式,加速創造業務價值》的主題演講,以創新的技術架構的視角,講解了如何發揮企業的數據價值。本文根據主要演講內容整理。
探索企業數據平臺的成功要素
研究數據發現,幾乎100%的企業都不否認數據是有價值的,對于大數據與人工智能的投資也在持續增長,但是,人們對于這些投資所能產生的商業價值的信心實際正在下降。76%的企業不認可自身是數據驅動型組織的公司,90%的人員和流程都遇到各種問題,導致無法借助數據來完成組織轉型。這些問題可歸于四方面:
第一,不能清晰的了解數據在哪些業務場景可以發揮商業價值,數據項目啟動難;
第二,企業的數據平臺匯聚著各方面數據,數據源難以規模化;
第三,通過數據分析生成各種指標畫像,疲于應對業務人員需求,數據使用難以規模化;
第四,數據項目的負責人通常是IT人員,對業務理解有所欠缺,不具備站在企業全局視角思考的能力,難以實現數據商業化。
我們迎面這些問題,將企業數據平臺的成功要素集中于三個要點,即在錯綜復雜的企業技術環境中快速啟動;規模化地引入高價值的新數據源和使用場景;盡早實現數據對整個企業商業系統的價值(對內或對外)。
從微服務的視角思考數據架構
數據倉庫、數據湖和云上數據平臺是大家常見的數據架構模式,也是企業數據平臺演進三個重要階段,而這三種數據平臺架構存在一些共性的挑戰。例如,巨型的數據孤島和無法克服的技術瓶頸、數據所代表的業務知識無法在生產者和消費者之間傳遞、基礎設施無法響應業務彈性需求等。
數據架構所面臨的挑戰,與微服務架構之前的單體軟件陷入的境況十分相似。傳統的單體軟件難以實現復雜的業務需求,因此出現了微服務的概念,實現IT技術的復用,能夠持續快速的響應、部署和迭代。微服務已經成為事實上的軟件架構范式,被企業廣泛采用。如今,這股浪潮開始席卷數據領域,如果我們的數據架構能夠以微服務的架構思想來設計,會帶來什么樣的改變?基于此思考,thoughtworks提出了Data Mesh的概念。
Data Mesh超越技術的范式轉變
Data Mesh 采用高度分散的數據架構,分布式數據平臺定義為一組面向域的數據或機器學習產品,用自服務的方式使用數據基礎設施提供的數據流水線(清洗、組合、豐富等)或合規(數據鑒權、隱私、安全等)的公共服務并接受數據產品思維的設計和管理,以及和企業交付基礎設施深度集成 。在Data Mesh架構下,基礎框架仍然是數據平臺,由IT團隊維護,不同的是賦以產品思維和管理,使數據生產過程產品化。
Data Mesh架構遵循五方面原則:
數據域對齊業務域,即將業務解耦之后映射到數據,再將數據解耦,減少數據冗余度,使其和業務緊密集合;
將數據視為產品,就如同微服務,在合規的權限體系下,可以被直接訪問和調用;
自服務的基礎設施,而數據的基礎設施相對于微服務的成熟架構還有所缺失,這也是未來需要持續發力的地方;
在生態治理方面,發現數據互相調用過程中的問題,解決節點和節點間的問題;
通過網格編排的思想設計數據走向,使數據產品能夠支持不同模塊、不同域的銜接。
Data Mesh的邏輯架構
數據分為數據生產者和數據消費者兩個層面。生產者是數據的源頭,來源于很多的業務系統;消費者是數據的使用場景,比如標簽畫像、推薦引擎。數據從生產端到消費端的過程就是數據變現的過程。我們要經過數據獲取、數據計算、數據存儲、數據標準連接,最終形成數據產品。這要求業務人員是具備數據思維的人員,去發掘數據價值究竟如何在業務場景中實現,起到橋梁的作用。那么,IT人員做什么?上層的數據治理包含數據標準、數據安全、數據質量管控等一系列工作,以及上文中提到的自服務基礎設施,都需要IT團隊來完成。
關于Data Mesh的實施建議
Data Mesh 架構的技術理念尚處于實踐早期,可能引發大家許多不同的觀點。我們遇到的最大挑戰來自于數據加工,但企業中的業務人員對于這樣的方法接受度普遍較低。
關于Data Mesh的實施,我們提出四點建議:第一,去中心化的數據并不意味著去中心化的基礎設施;第二,好的架構不是設計出來的,而是根據企業業務愿景和數據現狀演進出來的;第三,汲取產品思維所提供的知識財富;第四,Data Mesh不僅是數據架構問題,更是戰略和組織問題。Thoughtworks希望隨著Data Mesh 架構的逐步成熟,數據產品能夠傾向簡單,使業務人員更易于接受,助力企業發揮數據價值。
- 新聞
- 案例
- 推薦
- 觀點
- 研究報告
- CIO
- CDO
- IT/互聯網
- IT
- 大數據
推薦
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網-安-算-存-端"的全棧技術能力與國際生態合作成果。
張晶白
Thoughtworks
數據與智能解決方案總監
Thoughtworks 數據與智能解決方案總監
Thoughtworks數據與智能解決方案總監,首席咨詢顧問,擁有15年數據相關工作經驗。曾經與多家海內外知名跨國集團合作,協助制定企業數據戰略及構建創新數據產品,服務領域涵蓋金融、醫藥、汽車、制造、零售等多個行業。
我要評論