張向宏:激活數據要素價值潛能
2023-12-19
來源:CDO研習社
11月25日,2023全球數商大會在上海舉辦。北京交通大學信息管理理論與技術國際研究中心(ICIR)特聘教授張向宏受邀作為主論壇嘉賓發表題為《構建新一代數據基礎設施,激活數據要素價值潛能》的演講。
張向宏教授從國家數據基礎設施(NDI)的歷史演變、內涵、構成、特點以及障礙等五個方面對國家數據基礎設施進行了全面解讀。
以下為完整版演講記錄:
各位領導,各位嘉賓,大家下午好!今天非常榮幸能參加2023全球數商大會。
其實我今天跟大家分享這個題目,是受上海市在上個月19號發布了上海新基建的啟發,上海提出了5大新基建:第一個是新網絡,第二是新算力,第三個是新數據,第四個是新設施,第五個是新終端。
那么上海市在基礎設施,無論是傳統基礎設施還是新型基礎設施的新基建,應該說走在了全國的前列,為全國樹立了示范。
上海確實在數字經濟在數據要素化發展這個階段,應該說為全國樹立了典型和示范。所以我就說要跟大家分享我們團隊在新一代數據基礎設施方面的一些研究成果。
那么今天來到這里又聽到了,尤其是聽到了江小涓教授講到了數據的交易和數據的交互,她提到,數據的交易和數據的交互是數據開發利用數據流通的兩種主要方式,其中交互是更重要的方式,而交易其實跟交互相比較起來,它反倒居于次要的地位。
原因是江教授上午跟大家分享到,很多的客戶對于數據的訴求并不是要把數據拿出去去換錢,而是希望把數據從它全產業的鏈條上,從采集、匯聚、共享、開放、開發、交易、生產、流通、治理,從各個整個全鏈條打通。
那么其實江教授提出的從實踐中觀察到的現象,或者說我們現在就要是要支持從數據采集到數據交易流通的整個全生命周期的環節,其實我想到它是需要一個數據基礎設施的。
前天,劉烈宏局長在杭州剛剛發布國家數據局將推動數據基礎設施的四大設施和六大能力。
那么,我今天正好結合我們這個研究,將劉烈宏局長的數據基礎設施建設做一個簡單的解讀。
第一部分:從信息基礎設施(NII)到數據基礎設施(NDI)
1. 新階段
過去30多年來,全球經濟社會已從信息化階段全面轉向數字化階段,當前又從數字化階段向數據要素化階段進一步演化升級。
2. 新空間
全球網絡空間也從信息網絡空間升級為數字網絡空間,當前又從數字網絡空間向數據網絡空間迭代升級。
3. 新特點
而網絡空間的核心也已發生了從“以通道為中心”向“以計算為中心”轉變,當前正在從“以計算為中心”向“以數據為中心”的進一步轉型。
4. 新設施
相應地,各不同發展階段的基礎設施已從信息基礎設施發展為數字基礎設施,當前又從數字基礎設施向數據基礎設施轉型升級。
第二部分:國家數據基礎設施(NDI)的內涵
1. 基本含義
國家數據基礎設施(NDI)是經濟社會進入數據要素化發展新階段,支撐數據要素基礎制度實施,支持數據資源開發利用落地,全面促進數字中國、數字經濟、數字社會高質量發展的平臺和載體。
國家數據基礎設施(NDI)縱向上從頂到底分別是國家數據空間、國家軟基礎設施、國家硬基礎設施、國家數據安全基礎設施等四層架構,橫向上覆蓋數據采存算管用全生命周期各環節,包括數據采集平臺、數據匯聚平臺、數據加工平臺、數據共享平臺、數據開放平臺、數據運營平臺、數據交易平臺和數據存儲平臺等。
2. 基本特點
一是“是經濟社會進入數據要素化發展新階段”的基礎設施。二是“支撐數據要素基礎制度實施,支持數據資源開發利用落地,全面促進數字中國、數字經濟、數字社會高質量發展”的平臺和載體。
3. 縱向結構
國家數據空間、國家軟基礎設施、國家硬基礎設施、國家數據安全基礎設施等四層架構。
4. 橫向結構
數據采集平臺、數據匯聚平臺、數據加工平臺、數據共享平臺、數據開放平臺、數據運營平臺、數據交易平臺和數據存儲平臺。
第三部分:國家數據基礎設施(NDI)的構成
國家數據基礎設施(NDI)在基礎設施形態、數據全生命周期、行業和區域空間三個維度相互融合、相互支撐,形成支持數據全生命周期不同環節、不同行業、不同區域數據要素化的統分結合架構。
圖:國家數據基礎設施(NDI)參考模型
(一)國家數據基礎設施縱向架構
1.國家數據空間
國家數據空間由國家公共數據基礎空間、國家行業數據空間、國家區域數據節點空間組成。
能夠為數據持有者、數據提供者、數據生產者、數據消費者、數據應用程序提供者、數據平臺提供者、數據市場提供者、身份提供者等多種主體,提供自主操作、公平共享和交換、可信管理和認證、以及互操作等可信安全操作。
國家公共數據基礎空間是以“1+32+N”的全國一體化政務服務平臺和國家數據共享交換平臺為基礎,覆蓋國務院部門、31個省(自治區、直轄市)和新疆生產建設兵團的全國一體化公共數據資源匯聚共享、統一開放、開發服務基礎平臺。
國家行業數據空間是以數據規模大、數據質量高、應用場景多的N個行業,如金融、能源、水利、交通、鐵路、民航、氣象、通信、衛生健康、社保、文化文物、市場監管、生態環境等行業,形成的行業公共數據有序開放、互聯互通、深度應用的可信安全生產交易流通空間。
國家區域數據空間是以上海、北京、武漢、深圳、成都、西安、沈陽等覆蓋M個大區的中心城市為主節點,以區塊鏈、數據編織、隱私計算、大規模多源異構數據管理、大規模圖計算、智能數據工程等前沿數據技術為支撐,重點從產業數據樞紐、特色數據空間、數據共享開放運營應用、數據流通交易環境等方面,構建安全可信的數據生產流通平臺。
包括各省(自治區、直轄市)建成的省級一體化公共數據平臺,以及經此為依托建立的數據共享交換平臺、數據開放平臺、數據授權運營平臺、數據交易流通平臺等,構建數據跨層級、跨地域、跨系統、跨部門、跨業務可信安全流通的區域數據空間。
國家數據空間是國家數據基礎設施(NDI)的核心。應盡快確定1+32+N”的全國一體化政務服務平臺作為國家公共數據基礎空間的基礎,盡快確定首批參加國家行業數據空間的行業領域,盡快確定首批參加國家區域數據空間的節點城市,盡快啟動國家數據空間建設。
2.國家軟基礎設施
國家軟基礎設施包括兩部分內容,一是接入數據空間的各類主體、工具和數據的各種標準、協議、身份認證器和授權連接器;二是各種標準化和智能化的通用算法、模型和工具。
數據持有者操作工具指確保數據持有者能便捷修改數據的工具,包括數據授予、撤銷、更改訪問權限、指定新的數據訪問和使用條件等操作。
身份管理工具指確保參與者能確認數據共享的對象。產品認證工具指確保數據空間中的軟件連接器可以被信任。智能合約工具指確保數據僅被以特定的方式利用。
數據互操作性協議和標準指確保平臺上各主體間可以用相同方式進行交互。數據連接器為提供各類主體提供數據訪問和交換接口,確保數據在不同系統和設備之間無縫流動,確保驗證參與者的身份和授權并建立安全連接,確保數據的完整性和機密性,確保數據的使用控制。
構建通用算法模型和控件庫,包括集成自然語言處理、視頻圖像解析、智能問答、機器翻譯、數據挖掘分析、數據可視化、數據融合計算等功能的各種模型、工具和構件,提供標準化、智能化數據服務。
國家軟基礎設施是國家數據基礎設施(NDI)的關鍵。應當盡快組織國家重大科技攻關計劃和國家重大工程產業化項目,廣泛集聚網絡、通信、軟件、計算、存儲、標準、人工智能、區塊鏈等數據產業相關領域專家,擬建設國家行業數據空間的各部委信息中心領導專家,擬建設國家地區數據空間節點的各地方專家,組成數據接器、數據認證器、智能合約標準、數據產品認證工具、數據主體認證工具等科技和工程攻關團隊,在短期內實現國家軟基礎設施技術和產品突破。
3.國家硬基礎設施
國家硬基礎設施主要是在信息化和數字化發展階段形成和不斷升級的基礎設施,包括國家信息基礎設施和國家數字基礎設施,國家數字基礎設施又包括算力基礎設施建設和融合基礎設施等。
信息基礎設施主要包括新一代高速固定寬帶網、移動通信網、衛星互聯網等空天地海一體化信息網絡。算力基礎設施主要包括數據中心、超算中心和邊緣計算節點、量子通信、智算中心等。
融合基礎設施主要包括交通、鐵路、電力、能源、水利、生態、市政等領域傳統基礎設施數字化改造和智能化升級。
國家硬基礎設施是國家數據基礎設施(NDI)的基礎。應當遵循統籌布局、集約建設、資源共享、保障安全、適度超前、世界領先的原則,構建高速泛在、天地一體、云網融合、智能敏捷、綠色低碳、安全可控的國家硬基礎設施。
應合理利用全國一體化大數據中心協同創新體系,強化國家算力基礎設施和融合基礎設施的“底座”支撐能力,基于“兩地三中心”模式建立本地、異地雙容災備份中心。
4.國家數據安全基礎設施
國家數據安全基礎設施縱向貫通國家硬基礎設施、國家軟基礎設施、國家數據空間全層級,橫向覆蓋數據采存算管用全生命周期各環節的全國一體化數據安全監管平臺,包括全國一體化數據安全信息收集、分析和通報平臺,數據安全監測預警平臺,數據安全應急處置平臺和數據安全監督管理平臺。
國家數據安全基礎設施是國家數據基礎設施(NDI)的保障。應當同步建設“國家數據安全態勢感知平臺”,挖掘感知各類威脅事件,實現高危操作及時阻斷,變被動防御為主動防御,提高風險防范能力,優化安全技術應用模式,提升安全防護監測水平,為國家數據基礎設施保駕護航。
(二)國家數據基礎設施橫向架構
1.數據采集平臺
以政務數據采集為基礎,建立健全以數據庫采集、系統日志采集、網絡數據采集、感知設備數據采集等數據采集技術為基礎的標準化和智能化數據采集平臺,并鼓勵實現與其他公共數據采集平臺和企業數據采集平臺對接。
2.數據匯聚平臺
依托全國一體化政務服務平臺建立全國公共數據服務平臺。繼續支持各省級政務服務平臺的建設和完善,實現與國家政務服務平臺互聯互通。鼓勵水電氣暖公交等行業的公共數據,以及平臺企業和其他領域的社會數據,與全國公共數據服務平臺對接并實現數據匯聚。
3. 數據加工平臺
依托全國公共數據服務平臺,建立健全集成自然語言處理、視頻圖像解析、智能問答、機器翻譯、數據挖掘分析、數據可視化、數據融合計算等功能的構建通用算法模型、工具和構件,將人工智能技術深度應用于數據標注、數據分析、數據挖掘等數據加工生產流程中,形提供標準化、智能化數據服務和數據智能計算。
4.數據共享平臺
進一步建立完善現有國家數據共享交換平臺,實現政務數據在全國各政務機關跨地區、跨部門、跨層級共享和交換。探索水電氣暖公交等行業的公共數據,以及平臺企業和其他領域的社會數據,與國家數據共享交換平臺對接并實現政務數據、公共數據和社會數據之間的多方共享。
5.數據開放平臺
進一步建立完善現有國家數據開放平臺,不斷增加公共數據開放數量,持續提高公共數據開放質量。探索水電氣暖公交等行業的公共數據,以及平臺企業和其他領域的社會數據,與國家數據開放平臺對接并實現政務數據、公共數據和社會數據多方融合和免費開放。
6.數據運營平臺
充分利用數據目錄、數據集成、數據遷移、數據訪問、數據傳輸等各種數據管理技術,以及區塊鏈技術和各種隱私技術,依托全國一體化政務服務平臺建立各地區各部門公共數據運營平臺,推動公共數據授權運營、特許開發和融合應用開發等不同數據運營方式。
7.數據交易平臺
依托上海、北京和深圳等數據交易所已建立起來的數據交易平臺,通過機器學習、隱私計算、區塊鏈等先進技術,聚焦數據核驗、可信操作、智能合約、跨鏈協同等功能,建設“上海+北京+深圳”等數據交易所全面聯通的全國數據交易平臺,提供全國范圍的數據產品交易、數據資產憑證服務、數據流通交易合規監管等數據交易全過程服務,實現“一方備案,全鏈共享;一地掛牌,全鏈流通;一站交易,全鏈可溯;一證頒發,全鏈互認”。
8.數據存儲平臺
充分利用結構化數據存儲、列式數據庫、文檔數據庫、圖數據庫、搜索數據存儲、非結構化數據存儲、數據湖、藍光存儲等數據存儲技術,建立“一地三中心”的本地、異地雙容災備份的國家數據存儲中心。
第四部分:國家數據基礎設施(NDI)的三個特點
國家數據基礎設施(NDI)作為數據要素化發展新階段的新型基礎設施,具有對既有基礎設施的全面繼承性、適應新時期發展的鮮明創新性、以及對數據全生命周期各環節廣泛覆蓋性等三方面特點:
1.全面繼承性
國家數據基礎設施是數據要素化發展階段的新型基礎設施,是在以前信息化階段的信息基礎設施和數字化階段的數字基礎設施基礎上發展起來的。國家數據基礎設施對傳統信息基礎設施和數字基礎設施具有全面繼承性,信息基礎設施和數字基礎設施構成了國家數據基礎設施的硬基礎設施。
2.鮮明創新性
國家數據基礎設施不僅全面繼承了信息化和數字化發展階段已形成的國家硬基礎設施和國家數據安全基礎設施,而且在數據要素化發展新階段,創新發展出國家軟基礎設施和國家數據空間等基礎設施等新型基礎設施。國家數據空間、國家軟基礎設施等創新性基礎設施,與國家硬基礎設施、國家數據安全基礎設施等繼承性基礎設施,共同構成了國家數據基礎設施。
3.廣泛覆蓋性
國家數據基礎設施橫向上覆蓋數據采存算管用數據全生命周期各環節,對數據采集、匯聚、加工、共享、開放、運營、交易、存儲等業務形成全面支撐,并形成國家數據資源平臺、國家政務數據共享交換平臺、國家公共數據開放平臺、國家公共數據授權運營平臺、國家數據資源統一登記平臺、國家級數據交易平臺、國家級數據跨境交易平臺等新型國家數據基礎設施。
第五部分:國家數據基礎設施(NDI)的三個障礙
1.互操作性障礙
將不同行業、不同地區、甚至不同國家種類繁多的各種數據主體、數據產品、數據工具置于一個統一的數據基礎設施平臺和空間上,遇到的最大障礙就是相互間的互操作性。包括三個層次的互操作性障礙:
第一個層次是在同一環節的互操作。即在同一個行業、地區或國家范圍內的各種數據主體、數據產品、數據工具,通過一定規則在特定平臺上實現采存算管用某一特定環節的互操作。
目前各地區各行業出現的各種數據采集平臺、數據匯聚平臺、數據共享平臺、數據開放平臺、數據運營平臺、數據交易平臺等數據基礎設施,都是在特定行業或區域的特定數據流通環節,實現了數據主體、數據產品、數據工具等的相互認證和互操作。
第二個層次是在多個環節的互操作。即在同一個行業、地區或國家范圍內的各種數據主體、數據產品、數據工具,通過一定規則在特定平臺上實現采存算管用等多環節相互貫通的互操作。
如某些地方和部門在公共數據統一平臺上,構建的公共數據共享平臺、開放平臺和運營平臺,甚至有些數據交易平臺也是構建在公共數據統一平臺之上,這些地方和部門實現了在采集、匯聚、共享、開放、運營、交易等不同環節的互操作。
第三個層次是跨行業跨區域跨國別的互操作。即在不同行業、不同地區、甚至不同國家之間,不同的數據主體、數據產品和數據工具能實現在采集、匯聚、共享、開放、運營、交易等不同環節,跨行業、跨區域和跨國別的互操作。
2.場景規模化障礙
數據基礎設施支撐的數據應用規模越大,數據應用場景越多,在數據基礎設施平臺上吸引的數據主體、數據種類和數據工具就越豐富,數據要素的價值潛能就能得到更大程度發揮,數據基礎設施的平臺和載體作用就越重要。
數據基礎設施需突破三方面場景規模化障礙:
一是數據全生命周期場景規模化。數據基礎設施目前僅在數據交易平臺環節投資較大,應用較多,而在數據采集、匯聚、共享、開放、運營和存儲等其他環節還未形成集中化、規模化應用。應將數據基礎設施場景應用拓展到數據全生命周期的各環節。
二是更多的行業和地區場景規模化。數據基礎設施目前僅在部分政務部門建立了政務數據匯聚、共享、開放、運營和存儲等基礎設施平臺,還沒有覆蓋到各行業各地區。應將數據基礎設施從支撐政務應用向支撐行業和地區應用拓展,將數據基礎設施在政務領域的應用規模化地被復制應用到多個行業多個地方場景中。
三是大眾日常工作生活場景規模化。數據基礎設施僅在政務應用和部分2B場景有所應用,還沒有覆蓋到廣大的商用和民用領域,特別是還沒有覆蓋到眾多的互聯網數據平臺。應將數據基礎設施建設重點轉向對規模化、海量化的民用領域,必須覆蓋所有人民群眾所有生活生產領域。
3.技術成熟度障礙
數據基礎設施建設既要充分利用已有的區塊鏈技術、云計算技術、大數據技術、人工智能技術,也要創新應用聯邦計算、去標識化、同態加密、零知識證明、合成數據、可信執行環境等隱私計算技術。數據基礎設施的有效性在很大程度上取決于各種隱私計算的技術成熟度和隱私計算技術與傳統技術的融合程度。
數據基礎設施主要的技術障礙主要表現在以下三方面:
一是隱私計算技術的成熟度和公認度。目前在實踐中得到應用的隱私計算技術還遠未成熟,主要表現在兩方面,一是隱私計算技術種類眾多,但還沒有一項成熟的技術。
不同機構、不同產品使用了聯邦計算、去標識化、同態加密、零知識證明、合成數據、可信執行環境等不同隱私計算技術。
二是隱私計算技術路線多樣化,還沒有一條得到市場公認,相互間不兼容、不可互操作。應加快培育1-2種隱私技術,通過國家數據基礎設施大量應用形成市場優勢,并不斷發展成熟最終得到市場公認。
二是隱私技術的云計算、大數據和區塊鏈等技術的融合。目前云計算、大數據和區塊鏈等技術在信息網絡基礎設施和算力基礎設施已實現融合,隨著數據基礎設施不斷發展完善,各種隱私技術也將與云計算、大數據和區塊鏈等技術不斷融合,實現創新發展。
三是以隱私技術為核心的數據連接器和數據認證器的部署。在現有云計算架構下,數據連接器和數據認證器的部署形態是以公有云和私有云方式部署的。隨著數據基礎設施繼續深化發展,數據連接器和數據認證器將以一體機形態在各行業各地區數據空間部署。
今天我給大家匯報的內容就是這5個方面,雖然對結構的描述比較清楚,但面臨的問題也比較多.對于國家數據基礎設施(NDI),我們團隊也研究了很多年,那么我們今年在做這件事,我們覺得信心非常的足,我們認為這件事情肯定能做好的一個很重要的原因,國家數據局成立了,國家在舉全國之力在做這件事情,所以我們非常有幸趕上了一個時代,一個歷史轉折的關頭。
所以我們希望跟上海數據交易所、上海的各位同仁以及全國的各位同仁攜起手來。如果大家在數據基礎設施的方面的有什么樣的需要我們幫助的,可以跟我們聯系,謝謝大家!
- 推薦
- 觀點
- 制造
- 批發零售
- 房地產
- 住宿餐飲
- 金融
- 銀行
- 保險
- 證券
- 基金
- 交通物流
- 能源化工
- IT/互聯網
- 建筑
- 農業
- 教育
- 醫療衛生
- 采礦
- 租賃/商務服務
下一篇
推薦
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網-安-算-存-端"的全棧技術能力與國際生態合作成果。
我要評論