生成式AI十大趨勢:通用人工智能如何改變產(chǎn)業(yè)和生活
2023-10-30
來源:亮哥圓桌派
在快速發(fā)展的人工智能領域,生成式AI無疑是目前的大熱點,也是引領了AI領域潮流的最重要一部分,無論是其大語言模型、多模態(tài)模型、具身智能,還是通用人工智能等技術,都在不斷推動著智能科技的前進步伐。
亮哥今天來分享一下生成式AI的十大趨勢,從數(shù)據(jù)的力量到數(shù)據(jù)中心的AI變革,從大模型在個人助理角色中的應用到對勞動力市場的深遠影響,每個趨勢都在為人工智能領域描繪著精彩的未來。
一、統(tǒng)一未來:多模態(tài)模型加速文本、圖像和視頻融合
多模態(tài)模型是指能夠處理不同類型數(shù)據(jù)(如視覺、文本、聽覺等)并將它們融合起來進行綜合理解的人工智能模型。這種模型能夠更全面地理解和處理真實世界中復雜多樣的信息,從而進一步提升大型模型的遷移學習能力。多模態(tài)技術的發(fā)展在人工智能領域具有重要意義。
當前,單模態(tài)的人工智能模型,如處理文本、語音、圖片等的模型,已經(jīng)相對成熟。而大型模型正在向多模態(tài)信息融合的方向快速發(fā)展。一些重要的進展包括CLIP(Contrastive Language-Image Pretraining)模型的誕生以及GPT-4等模型的圖像處理能力的提升。大型模型不僅限于文字和圖像的處理,也開始拓展到音頻、視頻等領域。
未來展望方面,隨著多模態(tài)技術的不斷發(fā)展,模型將面臨更加復雜多樣化的交互場景。多模態(tài)技術將在智能家居、智慧城市、醫(yī)療診斷、自動駕駛等領域打開全新的應用空間,進一步推動人工智能的發(fā)展。
二、逾越虛擬邊界:具身智能成為AI發(fā)展新形態(tài)
具身智能是指那些可以感知和與物理世界進行交互,具有自主決策和行動能力的人工智能系統(tǒng)。這些智能體能夠以主人公的視角感受物理世界,并通過與環(huán)境的交互結合自我學習來理解和改變客觀世界。
近年來,具身智能被認為是計算機視覺領域的重要發(fā)展方向,被形容為人工智能研究的"北極星"。一些企業(yè)和研究機構推出了具身智能相關的產(chǎn)品和項目,如谷歌的RoboCat大模型和英偉達的Nvidia VIMA。
未來展望方面,通用人工智能和機器人產(chǎn)業(yè)正處在快速發(fā)展、相互融合促進的戰(zhàn)略機遇期。具身智能作為兩大領域交叉的核心應用,有望在未來取得快速發(fā)展。它將推動智能體具備更多自主規(guī)劃、決策、行動和執(zhí)行的能力,實現(xiàn)人工智能的進一步進階。
三、大模型智慧火花:走向通用人工智能的途徑愈發(fā)明晰,腦機接口創(chuàng)造新的交互方式
通用人工智能(AGI)是指具備類似于人類思考能力,能夠適應廣泛領域并解決多種問題的機器智能,是人工智能研究的重要目標之一。而狹義人工智能則指已取得顯著進展但局限于特定領域的人工智能,例如語音識別、機器視覺等。目前我們處于狹義人工智能相對成熟、通用人工智能乍現(xiàn)的階段,GPT-4等大型自然語言模型被認為是通向通用人工智能的重要潛在路徑。OpenAI的CEO薩姆·奧特曼表示,AGI時代可能很快就會到來,未來十年內行業(yè)可能會擁有超強的AI系統(tǒng)。
另一方面,人類與人工智能之間的交互方式也在不斷升級,腦機接口有望成為下一代人機交互方式。當前,腦機接口技術正在突破人類的生理界限,不僅為殘障人士提供了前所未有的可能性,還有望成為下一代的人機交互方式。
四、數(shù)據(jù)的力量:海量數(shù)據(jù)帶來模型能力涌現(xiàn),高質量數(shù)據(jù)提升模型性能
深度學習的進步建立在更大模型處理海量數(shù)據(jù)的基礎上。從GPT-1模型的1.17億參數(shù)到GPT-3的1750億參數(shù),模型的效果取得了顯著突破,并涌現(xiàn)出新的能力。然而,模型參數(shù)量的增加也帶來了算力需求的激增,模型架構和參數(shù)量提升帶來的收益正逐漸減少。
據(jù)阿伯丁大學、麻省理工大學等研究機構的報告,高質量的語言數(shù)據(jù)預計在2026年將耗盡,而低質量的語言數(shù)據(jù)和圖像數(shù)據(jù)將分別在2030-2050年、2030-2060年間枯竭。
以數(shù)據(jù)為中心的人工智能更加專注于數(shù)據(jù)的價值,進一步推動AI模型的性能突破。斯坦福大學的吳恩達教授提出了二八定律:80%的數(shù)據(jù)+20%的模型=更好的AI。數(shù)據(jù)中心的策略可以解決數(shù)據(jù)樣本不足、數(shù)據(jù)偏差等問題,高質量數(shù)據(jù)集成為推動模型性能進一步提升的關鍵要素,高質量的數(shù)據(jù)處理、數(shù)據(jù)標注服務以及完善的數(shù)據(jù)收集和評估體系的價值將進一步凸顯。
五、數(shù)據(jù)中心的AI變革:智算中心成為關鍵基礎設施
云計算是當前重要的AI算力提供方案,AI服務器市場獲得迅猛發(fā)展。根據(jù)TrendForce數(shù)據(jù),2022年全球AI服務器的出貨量約占整體服務器比重的1%,隨著大型模型訓練和推理的需求爆發(fā),AI算力資源需求預計將呈指數(shù)增長。根據(jù)IDC的數(shù)據(jù),未來5年中國智能算力規(guī)模的年復合增長率將達到52.3%,全球價值萬億美元的數(shù)據(jù)中心存量市場將從通用計算逐步過渡到AI計算。
云計算正從以CPU為中心的同構計算架構向以CPU+GPU/NPU為中心的異構計算架構深度演進。預計,大型模型帶來的GPU存量空間將從2023年的277億美元上升至2025年的1121億美元,以GPU為代表的AI計算資源在短期內將供不應求。
隨著專有領域計算需求的提升,AI芯片追求更高的性能和更低的功耗,芯片的多樣性和生態(tài)豐富性將不斷提升。一些頭部互聯(lián)網(wǎng)廠商將著力推進AI芯片的自主研發(fā),例如谷歌致力于打造專注于深度學習的TPU,并不斷豐富其AI生態(tài)布局。
六、大模型C端角色:個人智能助理與新一代的流量入口
大型語言模型將成為個人智能助理的關鍵。目前,大型模型已具備接入互聯(lián)網(wǎng)、進行內存管理等能力,通過目標任務自動拆分、計劃制定和計劃實施等方式,能夠自主完成用戶的需求,成為每個人的智能助理,例如制定旅行計劃并預定住宿和餐飲。
大型模型也將成為新一代的流量入口。GPT-4正逐步開放插件功能,通過底層模型連接第三方應用,構建豐富的生態(tài)系統(tǒng)。自插件功能開放以來,GPT-4已接入超過500個插件,包括教育、金融等領域。隨著大型模型能力的增強和插件生態(tài)的豐富,大型模型有望成為新一代的人機交互方式和流量入口。根據(jù)2023年5月的數(shù)據(jù),OpenAI官網(wǎng)訪問量為18.6億次,是全球第19名次的互聯(lián)網(wǎng)訪問IP。
七、大模型B端應用:專業(yè)數(shù)據(jù)與成本驅動行業(yè)模型百花齊放,打開廣闊應用空間
數(shù)據(jù)壁壘帶來企業(yè)端大型模型百花齊放。通用大型模型可以幫助用戶解決一般性問題,但當企業(yè)需要處理特定行業(yè)的數(shù)據(jù)和任務時,往往需要對基本模型進行垂直領域的微調。不同垂直行業(yè)具有不同特性和需求,因此大型模型的應用呈現(xiàn)多樣化趨勢。
B端應用出于對模型經(jīng)濟性的考量,未來將呈現(xiàn)階梯式、差異性需求。大型模型在垂直領域的商業(yè)化落地對模型的運行成本更為敏感,需要不同參數(shù)規(guī)模的大型模型組成多層次的產(chǎn)品組合,從而在不同場景下實現(xiàn)最佳的經(jīng)濟性,進一步提升大型模型的豐富度。
八、大模型輕量化:降低應用成本、帶動端側算力發(fā)展
隨著大型模型小型化和場景化需求的增加,同時出于對AI應用的經(jīng)濟性、可靠性和安全性的考慮,部分場景的推理將逐步從云端擴展到端側,帶動端側算力需求的進一步提升。
目前,多個大型模型都已推出“小型化”和“場景化”版本。例如,谷歌于5月23日發(fā)布的PaLM-2大模型中,最輕量版本“壁虎”可在移動端運行,運行速度快且支持離線操作。其他大型模型也有對應的小參數(shù)版本。
大型模型端側應用布局不斷加速。端側算力正在快速發(fā)展中,高通通過量化、編譯和硬件加速進行優(yōu)化,使Stable Diffusion能在搭載第二代驍龍8移動平臺的手機上運行。高通在微軟Build2023開發(fā)者大會上展示了最新的端側AI能力以及在下一代Windows 11上開發(fā)生成式AI的工具,并表示未來幾個月大型語言模型有望在端側運行。
九、大模型的深遠影響:重構勞動力市場、改寫科研范式
大語言模型對勞動力市場結構產(chǎn)生了深遠而復雜的影響。根據(jù)OpenAI聯(lián)合賓夕法尼亞大學的研究報告預測,約80%的美國勞動力可能有至少10%的工作受到大語言模型的影響。
大語言模型的應用帶來了勞動力市場結構的調整和變化。短期內,大語言模型可能替代部分低技能或重復性工作。中期來看,大語言模型也將創(chuàng)造新的與人工智能相關的就業(yè)機會。長期來看,大語言模型的應用將深刻改變各行業(yè)的工作模式和商業(yè)模式,讓企業(yè)的組織架構更加扁平化和小型化。在這個過程中,需要個人和企業(yè)積極適應,發(fā)展人類獨有的創(chuàng)新、協(xié)作和社交等能力,與人工智能共同進化。
此外,AI與前沿科學的結合展現(xiàn)出巨大潛力,可顯著降低前沿科技研究中的智力成本并提升研究效率。生命科學、氣象預測、數(shù)學、分子動力學等前沿科學領域均得到了人工智能的廣泛助力,AI for Science將帶來科研范式的變革和新的產(chǎn)業(yè)形態(tài)。
十、AI治理與技術的平衡:AI可解釋性亟待增強,監(jiān)管緊迫性日益凸顯
在人工智能的快速發(fā)展中,加強AI監(jiān)管與推動AI技術進步同等重要。人工智能的能力帶來了應用的便利性,但同時也可能引發(fā)數(shù)據(jù)隱私、算法偏見、AI倫理等一系列問題。
從技術角度來看,可以通過可解釋AI等技術手段增強AI的可信度。可解釋AI使人工智能的決策過程透明化,增加輸出內容的可理解性和可信任度,對于構建用戶對AI系統(tǒng)的信任、提升系統(tǒng)的有效性以及應對潛在的倫理問題都至關重要。
從規(guī)范角度來看,各國政府已經(jīng)開始采取行動,制定和執(zhí)行各種AI政策和法規(guī)。在4月份,我國網(wǎng)信辦出臺《生成式人工智能服務管理辦法(征求意見稿)》,明確了生成式人工智能的定義,為行業(yè)劃定底線從明確條件要求、劃定責任主體、形成問題處理機制、明晰法律責任等方面進行規(guī)范。
- 推薦
- 新聞
- 制造
- 批發(fā)零售
- 房地產(chǎn)
- 住宿餐飲
- 金融
- 銀行
- 保險
- 證券
- 基金
- 交通物流
- 能源化工
- IT/互聯(lián)網(wǎng)
- 建筑
- 農業(yè)
- 教育
- 醫(yī)療衛(wèi)生
- 采礦
- 租賃/商務服務
推薦
-
11月28日-30日,中國數(shù)字化年會將于成都正式開幕,本屆年會以數(shù)智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數(shù)字化轉型供需對接展。
-
零次方科技發(fā)布了其首款人形機器人,可以在多種不規(guī)則路面、復雜地形中長時間穩(wěn)定行走,且具備優(yōu)秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩(wěn)定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態(tài)布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯(lián)酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網(wǎng)-安-算-存-端"的全棧技術能力與國際生態(tài)合作成果。
-
中關村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟 顏陽-元宇宙產(chǎn)業(yè)的商業(yè)邏輯與技術壁壘研究
顏陽 中關村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長 ¥9.90 金錦囊免費
我要評論