AI 下一個風口在千行百業,私有部署普惠算力成熱點
2024-09-12
來源:極客公園
人工智能無疑是當今資本市場關注熱度最高的賽道。從英偉達、谷歌、博通,到商湯、百度、科大訊飛,今年以來股價連創新高的背后,都離不開 AI 帶來的無上限增長預期。
然而在業務端,隨著「百模大戰」塵埃落定,即便是在市場供需兩旺的強力推動下,由高門檻大模型主導的 AI 上半場似乎已經見頂。AI 的下一個風口將轉向何方?AI 下半場,誰又會成為真正的「頭號玩家」?
就算跑車買得起, 皮卡更有性 價比
即便在「百模大戰」猛卷降價潮的今天,對于企業、研究機構、千千萬萬的 AI 個人用戶來說,門檻焦慮依然普遍存在:大模型浪潮 B 端用戶應該怎么跟?哪些業務環節可以接入、如何提升?最關鍵的是,對普通的算力需求而言,動輒百萬級投入還難采購的 GPU 資源實在過于昂貴。
正如無論跑車買不買得起,有時皮卡更有性價比一樣,大模型的高高在上,反而推動參數更少、應用更好的小模型一路狂奔,成為 AI 大廠的新戰場。2024 至今,從國外的微軟、谷歌、Meata、OpenAI,到國內的獵豹、面壁智能,10 余家科技巨頭紛紛布局小模型,瞄準企業私有化落地場景發力。
可以看到,AI 生態正朝著大小模型分化共生的方向變化:大模型將繼續在精尖領域中發揮高端價值,小模型則將在成本敏感、對快速響應有剛需的場景中大放異彩。
OpenAI 創始成員 Andrej Karpathy 近日也向投資人坦承:小模型未來會有巨大潛力,「尤其是考慮到它可以部署在邊緣設備上,而不是依賴云計算,這很激動人心。」
AI 應用 改變 生活 ,更 在 重塑 產業 生態
使用 AI 視頻翻譯軟件,玩轉內容創作和業務出海;將一摞文檔交給 AI 助手,即可秒級檢索出特定答案;以前人工繪制一周的美工作品,AI 繪畫在幾分鐘內就能完成……「小模型+AI 應用」正在開啟一個新時代,作為 AI「三駕馬車」之一的算力,也在市場需求進化的同時迎來生態的重塑。
「AI 正在從云端向終端逐步演化,泛行業、小場景、長尾用戶必將占據主流,反過來推動智能算力向普惠化、低門檻的方式發展,未來智能算力一定會成為像水和電一樣低價便捷、隨取隨用的基礎設施。」東方材料(603110.SH)董事長許廣彬說,該公司依托全資子公司東方超算,長期為中國移動、商湯等頭部客戶提供一體化智算服務。
東方超算剛剛發布了一款低門檻、高性價比的普惠型智算產品——CalcDone E800 智算一體機,專門面向中小微型 B 端用戶,依托全球領先的虛擬化技術,全棧交付 5.2PFlops(FP16)智能算力,在算力規模、性價比、性能、擴容性、運維便捷度等多方面極具競爭力。
據介紹,AI 應用部署到一體機終端后,不僅減少了對網絡帶寬的需求和數據傳輸成本,更可實現更快的響應速度,私有化部署也保障了數據隱私與安全,全面滿足教育、醫療、制造等行業用戶(尤其是中小微 B 端用戶)對智算設施的需求。
IDC 報告顯示,2023 年中國智算服務市場體規模達 194.2 億元,同比增長 72.5%。在小模型+AI 應用跑出商業化加速度的新大陸面前,高舉高打的舊地圖已經失效,供需兩端都必須依靠新的戰略眼光和工具去解題——
從前行者的經驗看,用普惠算力破解成本焦慮已成最優解,率先搶占數量龐大的中小微用戶就等于預訂了未來市場頭部坐席的入場券。在 AI 技術作為牽引力、算力基石作為推動力的雙重作用下,可以斷言,AI 下半場仍舊「速」不可擋。
- 新聞
- IT/互聯網
- CIO
- CDO
- IT
- 人工智能
推薦
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網-安-算-存-端"的全棧技術能力與國際生態合作成果。
我要評論