中國(guó)移動(dòng):面向超萬卡集群的新型智算技術(shù)白皮書(2024年)
自 ChatGPT 發(fā)布以來,科技界掀起了一場(chǎng)大模型的競(jìng)爭(zhēng)熱潮。數(shù)據(jù)成為新生產(chǎn)要素,算力成為新基礎(chǔ)能源,大模型則成為新生產(chǎn)工具,各行各業(yè)從“+A”向“AI+”的轉(zhuǎn)變已勢(shì)不可擋。隨著模型參數(shù)量從千億邁向萬億,模型能力更加泛化,大模型對(duì)底層算力的訴求進(jìn)一步升級(jí),超萬卡集群成為這一輪大模型基建軍備競(jìng)賽的標(biāo)配。超萬卡集群將有助于壓縮大模型訓(xùn)練時(shí)間,實(shí)現(xiàn)模型能力的快速迭代,并及時(shí)對(duì)市場(chǎng)趨勢(shì)作出應(yīng)對(duì)。然而,如何在超萬卡集群中實(shí)現(xiàn)高效的訓(xùn)練,并長(zhǎng)期保持訓(xùn)練過程的穩(wěn)定性,是將大模型訓(xùn)練擴(kuò)展到數(shù)萬張 GPU 卡上所要面臨的雙重挑戰(zhàn)。超萬卡集群運(yùn)行過程中涉及到集群有效算力發(fā)揮、超大規(guī)模互聯(lián)網(wǎng)絡(luò)穩(wěn)定性保障、故障的快速排查和修復(fù)等關(guān)鍵問題,目前都是業(yè)內(nèi)關(guān)注的焦點(diǎn)。
報(bào)告信息
- 發(fā)布機(jī)構(gòu)
- 發(fā)布時(shí)間
- 報(bào)告價(jià)格
免費(fèi)
- AIGC
- 2024
- 數(shù)字經(jīng)濟(jì)
- 工業(yè)互聯(lián)網(wǎng)
- 智能制造
- 人工智能
- 免費(fèi)
- 非原創(chuàng)
- 人工智能
- 戰(zhàn)略
- CEO
- 大數(shù)據(jù)
- CTO
- 生產(chǎn)制造
- CIO
- CDO
- 案例
- 洞察報(bào)告
- 解決方案
- CMO
報(bào)告信息
- 發(fā)布機(jī)構(gòu)
- 發(fā)布時(shí)間
- 報(bào)告價(jià)格
免費(fèi)