中醫(yī)大模型來了!超1100萬條知識(shí)圖譜數(shù)據(jù)
2023-08-01
來源:量子位
國內(nèi)醫(yī)療大模型,現(xiàn)在又迎來了位新玩家。
還是以中醫(yī)為核心的大模型——
岐黃問道·大模型,大經(jīng)中醫(yī)出品。
作為國內(nèi)智慧中醫(yī)的代表企業(yè),以往它的個(gè)中進(jìn)展或許并不被廣泛熟知。
但它核心產(chǎn)品中醫(yī)臨床智能輔助診療系統(tǒng),實(shí)現(xiàn)了從基層村級(jí)衛(wèi)生室到三甲中醫(yī)院的應(yīng)用覆蓋,積累了400多家等級(jí)醫(yī)院、8000多家基層醫(yī)療機(jī)構(gòu)的用戶。
這也就意味著,一旦大模型規(guī)模化落地,就可快速實(shí)現(xiàn)到基層的應(yīng)用。
結(jié)果在發(fā)布會(huì)現(xiàn)場,它直接甩出三個(gè)子模型,還進(jìn)行了現(xiàn)場演示。
基于已確診疾病的臨床診療大模型;
僅僅基于癥狀、體征的臨床診療大模型;
中醫(yī)養(yǎng)生調(diào)理大模型。
以中醫(yī)養(yǎng)生調(diào)理大模型為例,只需輸入癥狀、體征信息。比如輸入怕冷及相關(guān)癥狀。
大模型就能輸出一系列多維度的養(yǎng)生方案來。包括中藥、經(jīng)絡(luò)穴位、食療、茶飲等一步到位。
△輸入怕冷及相關(guān)癥狀,給出系列養(yǎng)生方案
年輕人養(yǎng)生的第一個(gè)大模型,來了?!!
本以為這樣就結(jié)束了,但沒想到的是演示之后,大經(jīng)中醫(yī)竟然還直接公開了正在進(jìn)行的訓(xùn)練過程?!
這個(gè)玩家究竟什么來頭?中醫(yī)GPT首秀實(shí)力究竟如何?
中醫(yī)GPT實(shí)力如何?
那就來看看,這個(gè)岐黃問道·大模型的首秀能力如何?
主要分布兩大場景:中醫(yī)輔助診療、中醫(yī)健康養(yǎng)生服務(wù)。
首先是知病場景——基于已確診疾病的臨床診療大模型的現(xiàn)場演示,即輸入患者“疾病-癥狀-體征”信息,讓大模型輸出辨證結(jié)果、治則治法和中藥方劑。
一上來,它就會(huì)自稱「小經(jīng)醫(yī)生」,詢問需要咨詢的疾病。現(xiàn)場輸入慢性胃炎后,它會(huì)進(jìn)一步要求你提供相關(guān)的病情。
患者3年前出現(xiàn)胃痛,隱隱地痛,有時(shí)候會(huì)有胃熱的感覺。前年9月份去當(dāng)?shù)厝嗣襻t(yī)院做了胃鏡檢查,當(dāng)時(shí)診斷為淺表性胃炎。患者平時(shí)吃的比較少,胃口一般,口干,大便干,睡眠一般,舌紅,脈細(xì)數(shù)。
最終可以看到,它成功地推斷出了證型「脾胃陰虛型」,并給出了治法、處方以及用藥和用法。
目前該模型已經(jīng)通過“大經(jīng)數(shù)智中醫(yī)”微信公眾號(hào),向醫(yī)療機(jī)構(gòu)開放內(nèi)測申請。
而即便是那種沒有明確診斷的疾病,只輸入癥狀和體征信息。大模型也能輸出完整的結(jié)果來,即第二個(gè)子模型知癥。比如輸入“盜汗”以及相關(guān)病情。
而在健康養(yǎng)生場景下,只需輸入最近困擾你的亞健康問題,就能快速獲取一整套涵蓋艾灸、按摩、膏方、茶飲、膳食、湯羹等內(nèi)容的養(yǎng)生建議。
這樣的能力,離不開行業(yè)數(shù)據(jù)的支撐和訓(xùn)練。據(jù)大經(jīng)中醫(yī)技術(shù)總監(jiān)王祺表示,在大模型的訓(xùn)練中,主要用了這些數(shù)據(jù)集——
1100萬條中醫(yī)知識(shí)圖譜數(shù)據(jù);1500本中醫(yī)古籍和文獻(xiàn)數(shù)據(jù);10萬份真實(shí)中醫(yī)專家醫(yī)案數(shù)據(jù);10萬條脈象、舌象、經(jīng)絡(luò)、穴位數(shù)據(jù);200萬條真實(shí)的中醫(yī)臨床診療數(shù)據(jù)。
而為了這些高質(zhì)量數(shù)據(jù),大經(jīng)中醫(yī)過去投入了數(shù)千萬研發(fā)費(fèi)用。
具體訓(xùn)練方式也在這場發(fā)布會(huì)上,得到了公開呈現(xiàn)。
主要采用四層遞進(jìn)的訓(xùn)練方式:預(yù)訓(xùn)練→監(jiān)督微調(diào)→獎(jiǎng)勵(lì)模型→強(qiáng)化學(xué)習(xí)。目前,前兩個(gè)階段已經(jīng)完成,后兩個(gè)階段正在持續(xù)迭代中。
目前該訓(xùn)練系統(tǒng)正在由中醫(yī)和AI兩方面的專家協(xié)作完成。中醫(yī)專家評估的ID,已經(jīng)達(dá)到了1704605,足以見其數(shù)據(jù)規(guī)模。
敢一下子放出三個(gè)子模型,并在現(xiàn)場直接公開訓(xùn)練過程,大經(jīng)中醫(yī)底氣從何而來?
岐黃問道大模型如何煉成?
大模型最直觀的范式變革,就是新型人機(jī)交互關(guān)系的誕生。
不管是通用場景下的搜索引擎,還是垂直場景下的交互模式——
從UI、OS、EMR(電子病歷)等轉(zhuǎn)變?yōu)樽匀徽Z言。已預(yù)見到的是,「流量入口」、「知識(shí)獲取路徑」等都在這場變革中得到重新定義。
既然落地價(jià)值顯性,那具體到大模型在垂直場景應(yīng)用,大經(jīng)中醫(yī)CEO李文友認(rèn)為取決于這三個(gè)要素:
數(shù)據(jù):高質(zhì)量行業(yè)數(shù)據(jù)的獲取;
專家:業(yè)內(nèi)高水平專家對預(yù)訓(xùn)練模型的調(diào)整、反饋;
場景:具體場景的業(yè)務(wù)深耕,對具體場景的業(yè)務(wù)理解,以此實(shí)現(xiàn)大模型與行業(yè)的有效結(jié)合。
歸結(jié)起來,就是行業(yè)Know-how,多年領(lǐng)域深耕積攢下來的行業(yè)壁壘。
△大經(jīng)中醫(yī)創(chuàng)始人、CEO 李文友
于大經(jīng)中醫(yī)而言,這種“壁壘”可以具體展現(xiàn)在三個(gè)方面:
數(shù)據(jù)。
相較于其他醫(yī)療分支,中醫(yī)知識(shí)更為龐雜和個(gè)性化,而且歷來有“道不傳非人,法不傳六耳”的傳統(tǒng),這就導(dǎo)致高質(zhì)量數(shù)據(jù)非常私密,公開數(shù)據(jù)質(zhì)量又比較低,因而更需要垂直領(lǐng)域深耕。
據(jù)介紹,基于大量真實(shí)名老中醫(yī)的診療經(jīng)驗(yàn)和中醫(yī)文獻(xiàn)中的診療知識(shí),大經(jīng)中醫(yī)構(gòu)建了中醫(yī)診療知識(shí)圖譜 ,涵蓋內(nèi)外婦兒等全學(xué)科、經(jīng)方時(shí)方、孟河嶺南等全流派。據(jù)稱是目前業(yè)內(nèi)最高質(zhì)量的行業(yè)數(shù)據(jù)。
與此同時(shí),還建立了包含25000+個(gè)詞條的中醫(yī)癥狀、體征術(shù)語規(guī)范化詞典。據(jù)介紹,這也是行業(yè)中唯一大規(guī)模、覆蓋全病種的術(shù)語規(guī)范化詞典。這樣一來,能夠減少因?yàn)榇朕o差異導(dǎo)致答案不一致的影響。
目前,大經(jīng)中醫(yī)已經(jīng)積累了400多家等級(jí)醫(yī)院、8000多家基層醫(yī)療機(jī)構(gòu)用戶,形成了大量專業(yè)的中醫(yī)診療數(shù)據(jù)。
人才。
據(jù)了解,大經(jīng)中醫(yī)擁有全行業(yè)規(guī)模最大的中醫(yī)-AI跨界研發(fā)團(tuán)隊(duì),也擁有行業(yè)最大的名老中醫(yī)團(tuán)隊(duì),他們通過協(xié)議方式合作展開中醫(yī)AI研究,可在此次大模型研發(fā)中,協(xié)助開展RLHF工作提高性能。
此外,大經(jīng)中醫(yī)還與上海交大計(jì)算機(jī)科學(xué)與工程系等機(jī)構(gòu)專家合作,集成多方技術(shù)優(yōu)勢,共同開展中醫(yī)大模型的研究。
應(yīng)用。
場景應(yīng)用越豐富,客戶數(shù)據(jù)越龐雜,越有助于訓(xùn)練出更理解行業(yè)場景和業(yè)務(wù)的垂直大模型,并且在后續(xù)迭代中也能快速形成飛輪效應(yīng),更新速度越來越快。
大經(jīng)中醫(yī)現(xiàn)有的AI應(yīng)用場景實(shí)現(xiàn)了B端和C端的覆蓋——
包括廣東省中醫(yī)院、上海中醫(yī)藥大學(xué)附屬龍華醫(yī)院在內(nèi)的等級(jí)醫(yī)療機(jī)構(gòu);南京市江寧區(qū)、淄博市高青縣等區(qū)域中醫(yī)醫(yī)聯(lián)體,亦或是在上海長寧區(qū)“為老服務(wù)中心”這種大健康機(jī)構(gòu)應(yīng)用,以及下沉到山東、吉林等地村衛(wèi)生室這種基層醫(yī)療機(jī)構(gòu)的應(yīng)用。
而在C端,則以學(xué)習(xí)強(qiáng)國里的中醫(yī)智能健康助手為例,只需要選擇一些不舒服的表現(xiàn),就能推薦中醫(yī)調(diào)理方案。目前用戶已接近300萬人。
基于這三點(diǎn)核心優(yōu)勢,“岐黃問道·大模型”的技術(shù)路徑也就明晰起來。發(fā)布會(huì)現(xiàn)場,李文友透露大模型是這樣煉成的。
首先,從名老中醫(yī)臨床診療數(shù)據(jù)+中醫(yī)文獻(xiàn)數(shù)據(jù)到中醫(yī)診療知識(shí)圖譜。
用知識(shí)圖譜將這些數(shù)據(jù)結(jié)構(gòu)化、規(guī)范化,從而表達(dá)和存儲(chǔ)名老中醫(yī)診療經(jīng)驗(yàn)和文獻(xiàn)診療知識(shí)。
隨后,從中醫(yī)診療知識(shí)圖譜到中醫(yī)領(lǐng)域預(yù)訓(xùn)練模型。
利用千萬級(jí)的中醫(yī)知識(shí)圖譜數(shù)據(jù)和臨床診療數(shù)據(jù),微調(diào)通用預(yù)訓(xùn)練模型。
最后,從中醫(yī)領(lǐng)域預(yù)訓(xùn)練模型到岐黃問道大模型。
由中醫(yī)專家共同參與,利用獎(jiǎng)勵(lì)模型-強(qiáng)化學(xué)習(xí)機(jī)制,最終形成岐黃問道大模型。
,時(shí)長14:27為什么需要大模型?
大模型發(fā)展到現(xiàn)在,不管從個(gè)中進(jìn)展還是業(yè)內(nèi)聚焦探討,已經(jīng)從對技術(shù)本身的展望,逐漸具象到行業(yè)落地中去。
像華為盤古大模型在氣象上的應(yīng)用登上Nature頂刊,它可以在1.4秒就能完成24小時(shí)全球氣象預(yù)報(bào),比傳統(tǒng)方法快1萬倍。
在教育、游戲、廣告營銷以及礦山、藥物研發(fā)等領(lǐng)域,大模型都有相應(yīng)的落地應(yīng)用。
這兩天,北京交通大學(xué)還聯(lián)合發(fā)布了國內(nèi)自主研發(fā)首款綜合交通大模型TransGPT?致遠(yuǎn),并開源。
李文友認(rèn)為,在垂直領(lǐng)域乃至具體場景的應(yīng)用,正是大模型最大生命力所在。
關(guān)于「中醫(yī)大語言模型」打造,大經(jīng)中醫(yī)也透露了這兩個(gè)方面的原因。
從行業(yè)中看,中醫(yī)大語言模型有助于中醫(yī)藥「數(shù)智化」發(fā)展。
首先,中醫(yī)臨床診療數(shù)據(jù)、中醫(yī)文獻(xiàn)數(shù)據(jù)大多都是文本數(shù)據(jù)的形式。擅長自然語言識(shí)別處理的大語言模型則有助于中醫(yī)傳承發(fā)展。
其次,中醫(yī)臨床診療既具有完善的理論體系,又具有較強(qiáng)的經(jīng)驗(yàn)屬性,因此學(xué)中醫(yī)素來有“讀經(jīng)典、跟名師”之說。
這些經(jīng)驗(yàn)深藏于中醫(yī)文獻(xiàn)、典籍中,以及大量歷代醫(yī)家的醫(yī)案、醫(yī)話、醫(yī)論中,但理解、記憶、應(yīng)用這些經(jīng)驗(yàn)是一項(xiàng)艱難的任務(wù),中醫(yī)大語言模型的出現(xiàn),將大大改變中醫(yī)學(xué)習(xí)和人才培養(yǎng)的模式。
最后,從中醫(yī)的終極思維出發(fā),中醫(yī)不僅僅是醫(yī)學(xué),也是中國人的生活方式,這也就決定中醫(yī)不僅存在于醫(yī)院,也存在于家庭,以及各種與健康有關(guān)的空間。
而在更廣泛場景中,自然語言的交互方式更符合普通人的溝通習(xí)慣。這樣來看,中醫(yī)大語言模型,能更加推動(dòng)中醫(yī)AI更廣泛落地。
而除了行業(yè)維度,對于大經(jīng)中醫(yī)本身而言,還有更深層次的價(jià)值。
早在7年前,大經(jīng)中醫(yī)就提出:數(shù)智化是中醫(yī)藥發(fā)展的必由之路,并以此為實(shí)踐。
核心產(chǎn)品中醫(yī)臨床智能輔助診療系統(tǒng)(CDSS)建立起從三甲中醫(yī)院到社區(qū)衛(wèi)生服務(wù)中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院,再到診所、門診部、衛(wèi)生室的各級(jí)醫(yī)療機(jī)構(gòu)的應(yīng)用生態(tài)。
今年開始,進(jìn)一步集成了中醫(yī)臨床智能輔助診療系統(tǒng)(中醫(yī)智腦)、中醫(yī)智能脈診儀(中醫(yī)智指)、中醫(yī)智能舌面診儀(中醫(yī)智目)的大經(jīng)數(shù)智中醫(yī)一體化診療系統(tǒng)已經(jīng)逐步走進(jìn)更多健康服務(wù)場景。
△融合了大經(jīng)中醫(yī)一系列軟硬件產(chǎn)品的“數(shù)智中醫(yī)一體化診療系統(tǒng)”
用他們的話來講,大經(jīng)數(shù)智中醫(yī)一體化診療系統(tǒng)已經(jīng)從“嚴(yán)肅醫(yī)療”的生態(tài)圈,擴(kuò)展到“中醫(yī)大健康”的生態(tài)圈。
而現(xiàn)在,隨著岐黃中醫(yī)GPT的發(fā)布,大經(jīng)“中醫(yī)大健康”的生態(tài)圈將進(jìn)一步做大,加速更多健康場景的拓展。
發(fā)布會(huì)上,李文友演講最后還呼吁更多生態(tài)伙伴加入。
大模型加速企業(yè)生態(tài)圈建設(shè),也將進(jìn)一步加速行業(yè)領(lǐng)域發(fā)展,朝著更廣泛場景落地——
日常生活中,中醫(yī)也將隨處可見。
從企業(yè)出發(fā),到行業(yè),最后再普惠到每個(gè)人當(dāng)中,這也是大模型落地更多細(xì)分領(lǐng)域的變革范式。
大模型還可以在哪些領(lǐng)域碰撞出火花?不妨在這里期待一下。
- 推薦
- 新聞
- 醫(yī)療衛(wèi)生
- CIO
- CDO
- 研發(fā)
推薦
-
一年一度的中國數(shù)字化年會(huì)將于11月28日-30日再次攜手成都,為數(shù)字化轉(zhuǎn)型決策者們打造一場不可錯(cuò)過的年度數(shù)字化盛宴!
-
在這個(gè)日新月異的變革時(shí)代,我們將于11月28日-30日在成都舉辦“2024中國數(shù)字化年會(huì)”,匯聚行業(yè)精英與各界力量,共同探討數(shù)字化時(shí)代下的轉(zhuǎn)型策略與路徑。
-
11月28日-30日,中國數(shù)字化年會(huì)將于成都正式開幕,本屆年會(huì)以數(shù)智萬象 無界新生”為主題,設(shè)置2場主論壇、1場高峰論壇、5場專題論壇、4項(xiàng)特色活動(dòng)、2場頒獎(jiǎng)典禮等14項(xiàng)活動(dòng),以及2天數(shù)字化轉(zhuǎn)型供需對接展。
-
零次方科技發(fā)布了其首款人形機(jī)器人,可以在多種不規(guī)則路面、復(fù)雜地形中長時(shí)間穩(wěn)定行走,且具備優(yōu)秀的抗干擾性能,即使受到各方向的強(qiáng)沖擊也能保持穩(wěn)定站立。
-
近日,第四屆“青年科學(xué)家502論壇”在南方科技大學(xué)舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時(shí)代,我們應(yīng)該怎樣思考大模型》的主題演講,并給出了他對大模型的10個(gè)思考。
-
深度解析Meta Reality Labs的生態(tài)布局
-
中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟 顏陽-元宇宙產(chǎn)業(yè)的商業(yè)邏輯與技術(shù)壁壘研究
顏陽 中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長 ¥9.90 金錦囊免費(fèi)
-
《數(shù)智化敏捷組織》重構(gòu)、升級(jí)與進(jìn)化
肖利華 前阿里巴巴集團(tuán)副總裁、阿里云研究院 院長 清華大學(xué)博士后、中科院管理學(xué)博士、教授 ¥9.90 金錦囊免費(fèi)
我要評論