智譜 AI CEO 張鵬:AI Agent 是重要新風向,大模型競爭已步入混戰后期
2023-11-09
來源:極客公園
作者 | 連冉
編輯 | 鄭玄
相似的技術路線、商業策略以及愿景,智譜 AI 一度被稱為最有 OpenAI 氣質的中國公司。
作為首批網信辦批準向公眾提供大模型產品服務的公司之一,在近期完成 B-4 輪 融資后,智譜 AI 已經累計獲得超 25 億元融資,成為 AI 賽道備受矚目的獨角獸。如今,智譜 AI 的團隊有 400 余人,其中七成是研發人員,同時,核心團隊還新增了「智譜首席生態官」劉江——這位前智源研究院副院長,同時也是光年之外曾經的核心成員。
10 月 27 日,智譜 AI 在 2023 中國計算機大會(CNCC)上發布了新一代的瞄準 GPT-4V 的中英雙語對話模型 ChatGLM3 、國內首個具備代碼交互能力的大模型產品「智譜清言」,并在其 MaaS 平臺「智譜 AI 開放平臺」推出了新的商用部署方案:ChatGLM-turbo 版本,其 API 價格相較于直接部署 ChatGLM 降低了 50%。
考慮到 OpenAI 在技術上的領先性,智譜 AI 在產品研發上還是與其有相似之處。此次 ChatGLM 3 系列模型發布后,智譜 AI 更是成為了目前國內唯一一個有對標 OpenAI 全模型產品線的公司。
智譜 AI 對標 OpenAI 全模型產品線
在新模型發布后,智譜 AI CEO 張鵬和極客公園聊了聊他們的近況和一些行業認知。談到與 ChatGLM2 相比,智譜 AI 此次瞄準 GPT-4V 推出的 ChatGLM 3 性能更加強大,接入了具有多模態理解能力的模型 CogVLM、代碼增強模塊 Code Interpreter、網絡搜索增強模型 WebGLM,并增強了語義理解和邏輯理解能力,實現了若干功能的迭代升級。
智譜 AI CEO 張鵬
至于行業格局,在張鵬看來,「模型側已進入混戰的后期,格局會慢慢地清晰下來」。
以下為對話全文。
01AI Agent 新風向
極客公園:這次發布的新模型在性能表現上主要有哪些提升?
張鵬:10 月 28 日發布的內容其實之前已經分批次放出來了,只是沒有特別正式地向外界表示。提升的話,最關鍵的是整體上的性能提升。因為我們每一代模型相比上一代都會有一個階梯式的性能提升,提升程度的話,最低也會有 Benchmark 上百分之十幾的提升。按規律來說,這種上升曲線是會趨平的,因為越往后提升會越小。
但我們三代相對于二代的提升,比二代相對于一代的提升其實更大,這個是挺難做到的一件事情。這一點上我們也確實花了很多時間和精力,效果也非常的不錯。然后性能的提升其實也涉及到工程的效率問題,這個就跟商業化有關系了。
真正商業化的時候無非就考慮幾件事,第一個是成本,第二個是收益,價格和成本之間就是利潤空間,所以控制成本也非常的關鍵,這個是可以幫助你去擴大利潤空間的一個很重要的因素。所以說,推理效率提升了,我們成本也會降低,用戶體驗感也會更好。
這次我們還把智能體的能力提升也融合到了新一代技術里面。智能體它是基于底座的能力和一些特定的能力,去讓模型能夠幫助人去解決更復雜的需求和更復雜的問題的一項技術,它的能力是比較面向應用的。
就像一個人一樣,如果他只會回答問題,就算他的知識再多,他的回答問題再完整、再精確,他也只是一個問答機器。如果它不能做,不能利用別的東西,去完成一件復雜任務,那么它的能力始終有限,所以在這一點上來說,我們也自研了一些技術,包括怎么讓一個模型的智能體的能力大幅度提升。
極客公園:圍繞 AI Agent(智能體)的這種新風向,后續還會產生一些什么新的行業機會?
張鵬:AI Agent(智能體)的應用非常有空間和前景。原來模型的能力大多數都是對標 ChatGPT 那種對話式的,它不能做一些復雜的事情,只能回答問題,如何擴展它的能力?之前想過很多招,比如說 Plug-in platform 其實就是在擴展模型的能力,讓它能夠和現有的這些外界的系統去對齊,能夠去很自然、自動地去對接。那么 AI Agent 的這個能力其實是把這些東西都融合到一起,從模型層面來實現復雜任務的拆解,像人一樣進行規劃。
比如我有 plan A、plan B、plan C,plan A 我要分為 step one,step two,step three,一步一步的去執行。step one,我可能要去 call 一個外面系統的數據庫,step two,可能我要去做數學的一個計算,step three,可能我們需要去把這個計算的結果用一個自然語言去 wrap 一下,形成一個輸出,或者是形成一個表格,它是會有這樣的一些能力,來解決這些問題。
極客公園:那怎么看待 AI Agent 的未來?
張鵬: AI Agent 很重要。未來大模型能不能在實際應用當中產生更大的價值,或者說把它變成一個理想中的所謂的「大腦」的角色,而不是停留在 Q/A bot、Chat bot 的角色,很大程度上要看 AI Agent 的發展如何。
極客公園:距離它真的落地到實現你剛剛說的那種功能,大概需要多久的時間周期?
張鵬:會是一個加速的過程。因為 AI Agent 這個能力,從學術研究提出到現在大家可以體驗的過程是非常快速的,我相信后面真正到實際應用當中的過程會更快,因為現在你看它已經能做到一些事情了,雖然可能還有些瑕疵,有一些沒有不完美的地方,但我覺得隨著這個研究的深入,最終會加速實現更廣泛和深入的應用。
02共性問題在于
認知的參差
極客公園:智譜這次發布的新模型,是更注重行業的能力,還是說通用的一些能力?
張鵬:還是會 focus 在通用能力上。我們剛才說的所有這些能力都是通用型的。比如跨模態能力,我們沒有指定說我去讀醫療圖像還是讀取什么圖像,我們從來沒有這樣定義過這件事,它是個通用型的能力。
極客公園:后續商業化的規劃是怎么樣的?
張鵬:基座的這個能力真正到商業應用里面去,或者說行業應用里面去,它中間還是會有一定的 gap,雖然這個 gap 在不斷的變小,但還是存在的。那么這個 gap 怎么去彌合,要不就是模型能力不斷的往上漲,去接上它的這個需求,要么是中間加上一些產品、系統、解決方案等這樣層次的一些工作去彌補中間的 gap。
極客公園:在大模型領域做 B 端市場,給企業用戶做定制,會不會可能就是陷入到和上一波 AI 四小龍一樣的處境里?
張鵬:我們肯定不想這樣,過去已經證明了,就是說對于 AI 技術公司來講,這樣做是行不通的,當然也還有一些其他的因素在里頭就不展開了。
我們現在在做的事情是做好我們的底座、基座和賦能基礎能力。然后行業的這些應用,我們交給我們的生態,交給我們的合作伙伴,甚至我們可以交給客戶,如果客戶自己的技術能力如果夠強,我可以交給你,你自己去建。
極客公園:如果從行業的角度看的話,國內這波大模型創業公司,在商業化上有沒有一些共性的問題?智譜 AI 這邊會去怎么樣去規避這些可能的挑戰?
張鵬:是有一個比較抽象的共性問題,是大家對 AI 助手技術的認知參差不齊。首先,大家對它的能力上限和下限的認知,很難完全達成一致,需要一個磨合過程。如果對能力有過高預期,在交付使用過程中就會碰到許多困難;如果預期過低,則會覺得 AI 助手沒什么用處。這些可能都會讓人很難真的去接受這項新技術。所以,認知預期不一致是比較普遍的問題,這個就需要通過磨合達成共識。
基于這樣一些很新的技術,我們想要打造的生態,需要大家在整個大的生態版圖里面互相去磨合的。那么,哪些是面向客戶做解決方案的?他們是要怎么樣去引入這個技術,還是他們自己原創去做這個技術,自己去摸索這個技術?還是說他們要基于我們這個能力去做這個應用解決方案?其實大家的想法是千奇百怪的,差異很大的,這個也是一個很實際的問題。
所以我們在外頭跟大家聊的時候,或者說做這種演講的時候,都會強調這件事情,我們希望的是一個生態的打法,前面提的比如說行業性的行業模型、垂直模型或者是行業性的應用的空間我們是留給我們的生態合作伙伴,我們一起來把這個空間擴大。
通過這種方式把客戶價值的天花板持續往上抬,這是我們想要做的事。而不是說這個餅就這么大,大家在里面擠來擠去,你搶我一口,我搶你一口,這個事情永遠做不大,而且大家都會很累,所以說不要內卷,要反向外擴,這樣大家就會舒適一些,這是個很自然的想法,當然要做到這件事情還有很多困難,比如首先達成共識就很困難。
極客公園:各家還是想要凸顯自己。
張鵬: 當然大家最終都會找到自己在這個版圖當中的生態位。在這之前,他會擔心被別人擠掉或者被別人侵占掉,這是很自然的一個現象,所以他會有些選擇,總覺得好像得把所有東西都把握在自己手里,但是真正能不能把握得住,也許他就是得去拿腦袋往前拱一拱試試看前面是堵墻還是個什么東西,就是得試試看,這也是很正常的心態。
只是我們希望,盡量跟大家以一種開放的心態,去溝通和交流,去建立一些共識,盡量磨合的過程不要損耗太大。
極客公園:那你們是怎么去讓這個磨合變得更順暢一些的?
張鵬:主要是溝通。第一個是通過面對面的交流或者通過演講、媒體來輸出一些觀點、想法和態度,讓大家對我們的理念和做法有更多認識。第二個是通過一些已有的圈層,或者是社區,比如說開源,我們把我們的技術開源出去,把我們的一些經驗,一些技術上的積累,一些資料分享給大家。
這樣大家也會更深入的去理解這件事情它背后的價值、難度、成本等一系列的事情,然后根據這些他們自己會做一個判斷,自己能做到什么些事情,又很難做到些什么事情。還有一個是跟合作伙伴建立生態合作機制,可以針對性地結合他們所處的行業和能力需求去做一些技術培訓、聯合創新這樣的工作,來讓合作更加順暢。
極客公園:那在競爭上,大模型創業公司如何在商業化方面與巨頭競爭?怎么看待數據、場景、交互等因素的關鍵程度?
張鵬: 大公司肯定有大公司的優勢,比如它的資源、市場的積累,這些方面其實大公司的優勢比較明顯。那么創業公司的優點就是它比較靈活,可以快速變化,好掉頭,還有一點就是比較專注,可以把所有的資源和精力全投注過去。
03開源閉源并不矛盾
智譜 AI 模型開源時間線
極客公園:剛剛也提到了開源,之前我們采訪月之暗面 CEO 楊之麟的時候,他就說可能在未來,超級應用一定會誕生在閉源,因為就是它能夠更加深入的去開發。關于這個你怎么看?
張鵬:開源和閉源的關系,至少我個人來看,從來不覺得是一個完全對立的事情。
開源是一個可以保持行業或者技術領域活躍性的一件事,可以保持生態圈的多樣性、活躍性。因為開源社區的參與者都比較活躍和投入,都是相對愿意去做貢獻的一群人,他們的討論,他們的交流,還有對開源項目的代碼貢獻,經驗貢獻,其實也有幫忙推動技術探索,提出更多的選擇和可能性,也就是我們也會從開源中可以獲得很多反饋和營養。
閉源的話更考慮商業價值的穩定性、服務的持續性和安全性,因為企業有一定的主體責任,也有商業回報的訴求,這個是對等存在的。
總之就是,開源會保證生態,然后閉源會保證商業服務的價值,兩者之間其實并不矛盾。
極客公園:超級應用還是會產生在閉源項目里。
張鵬:當然很難想象一個超級應用是直接建立在一個開源項目上,它可能還是要走商業版本去做,因為它涉及到的事情很多,而不是說開源一個項目,或者說扔出來一個產品就可以,如果沒有后續的運營維護等等這一系列的服務,怎么可能做得成超級應用?
當然超級應用并不是未來的唯一解。超級應用當然是大家都想做的事情,這個毫無疑問。誰不想做這樣一個東西?但具體這個超級應用是啥,現在也沒人能說的清楚。
極客公園:除了超級應用,還有一些什么可能的比較好的解法?
張鵬:這個就跟我們本身的發展戰略也有關系。一個是像應用這一塊,我們也有在做 App,我們的切入點就是像智譜清言這種 AI 助手,這個方向可能會是未來的超級應用之一,畢竟這個需求還是特別明顯。
另一個是我們還是更多 focus 在做基礎模型、通用模型這一塊。從商業落地的場景上來看,我們還是會以基礎模型為基礎,去賦能上層的比如行業、應用、客戶等等這些層面。
04ChatGPT 3.5并非 Golden Rule
極客公園:最近很多國內廠商都標榜自己的大模型達到了 3.5,從技術角度來看國內頂尖模型是否真的達到了 ChatGPT 的水平?有一種說法年底能否達到 3.5 會是國內這波大模型創業的分水嶺,你怎么看?
張鵬:國內這些當然也在看,但是我們其實并沒有特別的去對標過。我們也從來不認為說 ChatGPT 3.5 是個終點,或者說是個試金石什么之類的,它只不過是這個過程當中的一個 check point,就是大家在這個點上 check 一下,有一個對標,就是看看能做到什么。
因為 Open AI 跑得快,它跑過去了,留一條線給你,你什么時候能跑過這條線,或者像跳遠一樣,跳到一個及格線或者一個達標線,這樣的一個概念。但這個線也不是說特別精確,只是大家需要的一個激勵自己或者檢驗自己進步的一個標尺而已。
所以你不能把它當做一個 golden rule 或者是用來 check 的一個精確標準,當然大家愿意去拿一個比較統一的標尺去量這個事情,也是個好事。那怎么實打實地拿出 evidence 來證明你真的做到了,那又是另一件事。
極客公園:那你覺得這個分水嶺會是什么呢?
張鵬:從技術或者說行業發展的角度來看,我沒覺得這件事情有一個這樣的分水嶺。因為技術始終是不斷向上發展的。這個東西只是一個標尺,大家共識里面的一個標尺,標識越共識,大家越容易理解,但并不代表這個事情它就是個達標線。也沒有人說你做不到 ChatGPT 3.5,你就別來做了,或者是也拿不到錢或者什么之類的。
而且不能簡單用 ChatGPT 3.5 作為唯一標準來評判其他模型。畢竟每個模型有自己的定位,不應該片面用一個模型的能力水平來評判其他模型。
不同的模型可以解決不同的問題,服務不同的需要。應該鼓勵多樣性,而不是要求所有模型都追求通用性。每個模型都可以通過自己的方式找到價值所在。一個模型的成功與獨特之處,不是只用能力高低就能簡單劃分出來的。
這么來說吧,可能除了一個共識的標準,還有大量空間可以進行創新探索。
極客公園:技術肯定是不斷向前發展,那從公司的視角怎么看?
張鵬:我覺得這個事情越往后推,肯定是趨向一個總體穩定的過程。昨天其實也有人問,最終大模型的這個廠家會剩下幾個,大概的一個共識是做通用基礎模型的不會超過 10 家,因為這件事情太耗錢,技術密度太高,未來也不需要那么多通用的基礎模型。因為同質化比較嚴重的話,需要那么多干嘛?
除了這些通用技術模型以外,其他的比如 Midjourney,Character AI 這一類的行業的,或者一些專業的模型和應用,還是會不斷的涌現。
05大模型競爭已步入混戰后期
極客公園:怎么看待當前大模型行業的競爭格局?
張鵬:基本上在模型本身這一側的話,現在是混戰的后期,格局會慢慢地清晰下來。
極客公園:現在大模型創業的環境與之前最火熱的時期相比有哪些變化?投資、政策等因素又帶來了哪些挑戰?
張鵬:我比較贊同紅杉資本的公眾號有篇文章講的,現在進入到了一個新的階段,這個新的階段跟之前那個階段略微會有些差異。
之前火熱是大家都沒把這些事情想的特別明白,投資也好,政策也好,市場的期待也好,大家是把它胡子眉毛一把抓的。不管你是做基座模型的,做行業模型的、還是做應用的,反正只要是跟這個沾邊,都算到這個里頭。
但是到了現在這個階段,大家逐漸的會把這些嘗試分開來看,誰是做通用的,誰是做行業的,誰是做應用的,可能慢慢地就會把它分清楚。
極客公園:在這樣的一個背景下,你認為哪些方面的差異會讓智譜AI能在行業內站穩腳跟?
張鵬:這個事情對我們來講其實是比較明確的。首先第一個我們對這件事情的認知和目標非常明確,就是聚焦在基座和通用的基座模型上、技術模型上。然后行業應用、商業落地就用生態式的方法來做,當然核心的還是我們自己的技術。隨著時間往后,大家對我們的認知也越來越趨同和一致,這是個好事。
極客公園:在你看來,這次新模型意味著智譜 AI 在大模型領域將達到怎樣的技術地位?
張鵬:我們基本上是跟自己比和跟 OpenAI 比,因為 OpenAI 是做的最好的,我們基本上是這樣來比,那至于國內的水平,大家各自心里有把尺可以去量。
極客公園:智譜 AI 下一次在模型上的迭代會是在什么時候?
張鵬:我們一般的迭代周期就是 3 到 6 個月一代。上次二代是 6 月底,這次是 10 月底。
極客公園:現在你們的團隊規模?
張鵬:就是大概的規模是 400 多人,當中有 70% 左右的研發,當然這個研發是比較寬泛的概念。
極客公園:在 27 號的現場演示過程中,智譜清言在代碼理解上出了一些 bug(輸入了「生成一顆紅心」的代碼,最后給出繪畫結果卻是兩條函數),所以智譜清言在準確度上的水平是怎么樣的?
張鵬:準確度肯定在持續提升。當然這個具體的成功率或之類的,你可以去試一試,可能每個人自己的體感不太一樣。根據測試的用例、測試的方法周期范圍,只能是無限的去逼近準確,但也沒辦法做出最準確的一個測算。雖然整體成功率還是比較高,但是現場演示的確會有一些風險,這個也沒辦法,我們還是希望把真實的演示呈現給大家。目前就是這樣一個情況,真實的演示也反映技術本身。
理想狀況下的「生成一顆紅心」
極客公園:之前有其他大模型出現了不實的一些 AI 生成內容,像這種大模型的幻覺問題上,你們這邊是什么樣的進展?
張鵬:這個事是這個「老大難」問題,現在也沒有人說能夠有辦法把它根除掉。我們在討論這件事情的時候,大部分還是說得從技術上想辦法去解決這個問題,比如引入知識,或者引入這種符號的一些方法,來幫助我們解決這個問題,也可能 super alignment(對齊)可以解決這個問題,當然 super alignment 是一個整體上的大的方向,它里面具體用什么方法,還是需要繼續去嘗試。
- 推薦
- 觀點
- IT/互聯網
- 科研/技術服務
- 軟件信息
- CEO
- CTO
- CIO
- 數字經濟
- 人工智能
- 戰略
- 運營
- 市場營銷
- IT
下一篇
推薦
-
一年一度的中國數字化年會將于11月28日-30日再次攜手成都,為數字化轉型決策者們打造一場不可錯過的年度數字化盛宴!
-
在這個日新月異的變革時代,我們將于11月28日-30日在成都舉辦“2024中國數字化年會”,匯聚行業精英與各界力量,共同探討數字化時代下的轉型策略與路徑。
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
我要評論