亞馬遜云科技:云計算賦能金融文本數據智慧處理
2021-09-01
來源丨騰訊新聞
金融行業面臨的數據挑戰,比我們很多人想象得更加嚴峻。爆發式增長的數據從四面八方奔涌而來,包括市場行業數據、企業財務數據、金融交易數據等。
以上交所和深交所為例,去年9月,兩市上市公司剛剛突破4000家,而今年4月,最新的數字已經是4302家。每次到了財報季,各種報表更是如雪花般飛舞。
對企業的文本和財務報表進行審核和分析,是金融行業非常重要的工作內容之一。面對短期間涌入的數千份季報、半年報和年報,每份都在兩三百頁上下,里面包含了企業的主營數據、經營數據、公司治理數據等海量信息,信息的背后隱藏的是投資與信貸的風險,也蘊藏著潛在的商機 。低成本、快速、準確讀取文檔內容,理解語意含義,并形成規范化、可被自動化處理的知識標簽顯得尤為重要。
在傳統的模式下,數據的分析、錄入和審核全部采用人工審閱模式,這無疑極大地降低了業務效率,容易造成商機錯失,任何人為疏忽導致的錯誤,可能會給銀行帶來巨大的風險。
基于此,通過OCR(光學字符識別)技術來實現各種業務場景的智能化,已經成為當前諸多銀行的首選。作為一項枯燥繁雜、重復度高、工作量大的業務,財報的數據錄入和分析顯然是OCR技術大展身手的空間。
最近幾年,由于云上模式逐漸成為趨勢,原有的OCR已經難以滿足行業需求,畢竟我們無法將每一份財報都轉化為紙質版,而且在當前數字化飛速發展的應用環境下,也無需這個必要。
我們知道,目前國內常用的財報格式是PDF文檔。在工作中直接引入機器智能,通過OCR而不是人類雇員來“閱讀”PDF財報,將會為金融機構帶來極大的效率提升,也能夠有效地縮減金融機構的運營成本。
OCR與人工智能,以及機器人流程自動化等技術的“一相逢”成為了“勝卻人間無數”的提升運營效率的法寶;為更多的金融機構業務帶來巨大的優化和發展空間。
對于各種金融應用場景而言,智能OCR機器人正在成為一大利器。它能夠做到的不僅是高效率的識別,得益于技術底層的嬗變,它甚至可以對相關的條文和具體內容進行“閱讀”。
在亞馬遜云科技看來,智能OCR一直是充滿活力的研究領域,在不斷出現的新型行業應用場景中,智能OCR的既有價值顯而易見,潛在價值又難以估量。
基于相關的技術與云服務,亞馬遜云科技在中國市場近期推出了一系列本地“原生”的、用于金融行業的解決方案,幫助企業盤活數字資產,以AI創新場景,支持金融企業的數字化轉型。
亞馬遜云科技的智能公告文本知識標簽提取機器人方案,便是其中一個面向金融行業的解決方案。該方案利用Amazon SageMaker機器學習服務,Amazon Neptune圖數據庫服務和金融行業資產盤活機器人解決方案,對上市公司公告、研報等文本進行分析與實體抽取,形成知識標簽,提升銀行和證券機構識別外部風險與商業機會的效率。
利用這個方案,不僅可以從上市公司公告中提取價值信息,也可以“閱讀”法院公告、工商、互聯網媒體、路透、征信、網點監控等不同的數據來源。針對上市公司公告、研究報告,通過利用智能公告文本知識標簽提取機器人方案,銀行就不必在季末抽取大量人工投入分析文本、提取內容,而可以將這些專業資源用于其他高價值工作。
與傳統OCR不同的是,該方案對財報的分析絕不僅僅是提取其中的數據,還包括了高管變動等關鍵信息。其中,AI 模型可以對文檔進行自動分析與文字抽取,將識別出的數據、文字等信息,進行實體識別與關系抽取,形成知識標簽,通過圖數據庫進行保存,便于前端進行查詢和展示。
該方案以Amazon S3為基礎,聯接了Amazon Neptune、Amazon AppSync、Amazon DynamoDB等不同的服務,通過數據預處理、數據抽取和數據后處理,進行智能文本處理服務,基于數據的生命周期,最終幫助客戶構建起智能業務平臺和專業服務隊伍。
通過亞馬遜云科技的智能公告文本知識標簽提取機器人方案,金融機構可以高效率地進行如財報等文本的處理和分析,從更多的數據來源提取價值信息,從而及時發現商機、規避風險。
“對于金融行業來說,這是一種很典型的資產激活。”亞馬遜云科技中國地區的金融解決方案相關負責人表示。
需要說明的是,亞馬遜云科技由中國本土團隊提供的金融行業解決方案依托開源框架,支持多種框架和模型, 用戶對架構和模型自主可控。
其次,用戶的數據仍處于自己手中,而不是第三方的服務平臺上,他們可以利用這些自有數據,進行OCR 模型的增強訓練和精度提升,實現業務的更多可能性。
再次,借助機器學習平臺Amazon SageMaker和圖數據庫Amazon Neptune,亞馬遜云科技的方案可以在OCR識別出文字的基礎上,進一步進行智能的實體識別與關系抽取,形成知識標簽,支持風控、營銷、推薦等業務產品的開發,并可引入圖神經網絡算法模型,走進更多的業務場景當中。
最后,我們還必須提及亞馬遜云科技金融行業解決方案的云端優勢:彈性伸縮、資源按實際用量付費,用戶可以隨時根據自己的需求開啟服務,節省不必要的花費。
通過以上方案,亞馬遜云科技可以幫助金融機構解決長期以來針對文本數據提取利用的“痛點”,實現智能OCR和機器人技術在創新業務場景中的應用突破,助力金融機構在新時代的高質量發展。
亞馬遜云科技中國峰會線上峰會將于2021年9月9日至9月12日與大家線上見面!屆時,在金融分論壇,您將了解到有關亞馬遜云科技金融行業解決方案及成功應用實踐,歡迎觀看!
- 新聞
- IT/互聯網
- CIO
- CDO
- IT
- 云計算
推薦
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網-安-算-存-端"的全棧技術能力與國際生態合作成果。
我要評論