2023年,大模型+虛擬人開始給娃上課了
2023-08-02
來源:中國電子報
“你的下一個外教,何必是外教?他可以是大模型加虛擬人。”這是若軒在試用完Hi Echo的感受。
若軒最近沉迷于Hi Echo這款APP。打開Hi Echo點擊通話,名叫Echo的虛擬人就可以提供7×24小時私人英文口語陪練。這款網易有道推出的AI虛擬人口語教練產品,底座基于網易有道研發的教育垂直大模型子曰。
不同于通用大模型,子曰從一開始就定位為一個場景為先的教育垂類大模型。
時間回到2022年11月底,ChatGPT發布之后,周楓試用后感到非常震撼。他跟算法團隊來來回回地用,測試它的能力底線,在公司內部評測模型不同能力的細節。為了了解更多技術細節,周楓把從GPT-2開始的所有語言模型相關的論文全部讀了一遍。他和團隊一直在思考,ChatGPT、大模型跟有道到底有沒有關系?有道到底要做什么?有沒有合作方可以調用?
2023年1月,有道內部召開年度戰略會,這是公司每年的傳統,周楓把總監以上的團隊集中在一起連續開三天會。不同于往年,今年周楓讓有道首席科學家段亦濤講了一個多小時的GPT相關的技術,讓大家做了充分的討論。
一部分同事對即將到來的技術浪潮還很懵。最苦悶的要數翻譯團隊——殘酷的現實擺在面前,之前干的事情都沒用了。
當時,美國可汗學院等教育公司已經開始嘗試接入GPT-3.5,做一些教育服務嘗試,但國內還沒有能力綜合又非常成熟的可以接入的模型,必須得自己做。
很快,周楓就和團隊達成共識。“新一代技術來了之后,有道一定要抓住,不能做鴕鳥。如果你抓不住,你掉隊了,從此就是一個跟隨的角色,何況原來也有一些技術優勢。”周楓告訴《中國企業家》。
2023年開年,有道內部就開始緊鑼密鼓地研發垂直大模型,各個場景的應用申請也不斷發起。周楓要求每個業務團隊都要關注大模型,在他看來這是十年甚至幾十年才一遇的機會。
除了有道內部,網易集團和創始人丁磊也給予了足夠的重視程度。丁磊親自抓集團內部的AIGC大賽,并親自做評委主席,Hi Echo的虛擬人外教正是有道與網易游戲合力研發的結果。
截至今年7月,網易有道除了自研教育垂直大模型之外,還基于自研大模型推出“AI虛擬人口語教練”“LLM翻譯”等6大應用。
在周楓看來,一個好的技術有沒有價值、能不能發揮巨大的作用,很多時候關鍵在場景和應用的選擇以及細節的打磨。
抓場景和應用
作為資深技術從業者,周楓過去20年見證了好幾輪技術變革浪潮,歷史經驗告訴他,每一次大的浪潮里,機會不僅僅在于基礎技術。就像互聯網發展之初,做服務器和路由器的公司最賺錢,但大家很快就發現互聯網的精髓不在路由器,而是在互聯網應用上。
大模型來臨之后,周楓立馬想到的就是應用和場景:“大模型作為基座支持很多下游任務,這是它非常重要的優勢,抓得越早,后邊可抓的東西越多。如果眼睛全盯著要去做大模型,就像移動互聯網時整天盯著怎么做手機,而忽視了微信、淘寶、抖音等應用的機會。”
在結合過往業務尋找落地場景應用的過程中,周楓有兩個原則:第一,解決用戶的需要;第二,能快速變現,有足夠的商業空間。他認為,即便是200億參數的模型能力,也可以解決教育方面很多的問題。
當然,周楓也深知沒有一個辦法可以解決所有問題。但從2006年網易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業務,業務范圍覆蓋K12教育、成人教育、素質教育、智能硬件等領域,讓教育大模型落地有了眾多的場景。
隨著ChatGPT在國內的普及,有道的技術團隊見證了用戶行為的快速改變。周楓回憶,與有道翻譯會員關聯的AIBOX才上線幾個星期,桌面端會員的四分之一的收入就來自于該功能。
這是一個用戶在翻譯等眾多場景可以用到的功能,比如回一封正式的英文郵件或給海外大學寫一封申請信,大部分中國人可能擔心語言不地道,詞不達意,AIBOX則可提供潤色的功能——用戶選中一段英文,可以根據自己的需求讓它更專業,原本需要找英語母語者或文書專家修改的稀缺能力,變得唾手可得。
文本翻譯之外,Hi Echo聚焦的英語口語陪練也是其重視的場景之一。他認為,口語陪練一直以來都有幾百億的市場規模,這里面創新空間非常大。中國人學外語最大的困難不是詞匯,也不是語法,而是沒有語言環境,可語言環境非常難創建。
“以前創造語言環境的唯一辦法就是請外教,花很高的價格請外教每個星期聊幾個小時,但外教最大的問題在于資源太少且太昂貴了。只有非常少數的學生家庭能夠支付得起這樣好的語言環境,但技術革新不就是解決這樣的問題嗎?”周楓告訴《中國企業家》。
在周楓看來,隨著大模型能力的提升,讓“因材施教”獲得三大優勢:
首先,大模型能為學生提供個性化的分析和指導;
其次,大模型能夠實現引導式學習,與教師一樣,提出問題并引導學生自行探索答案;
最后,大模型具備全科知識整合能力,通過連接多模態知識庫、跨學科整合知識內容,大模型能隨時滿足學生的動態需求,幫助孩子培養更綜合的能力。
“怎么這個東西又火了一遍”
2023年春節后,當大眾也開始對ChatGPT津津樂道的時候,有道技術團隊的感覺是,“怎么這個東西又火一遍?”
因為過去的積累和技術的敏銳度,有道技術團隊在GPT-3.5出來的時候,也就是2022年12月到2023年1月間拼命關注、研究和測試,跟行業投資人和創業團隊交流,考慮如何跟自己的業務做結合。
Transformer技術是現在AI的主流技術,GPT中的T也是Transformer的縮寫,而Transformer正是從機器翻譯開始做的,第一篇Transformer的論文也是與機器翻譯相關的。
2017年,周楓接觸到Transformer,而早在2008年,有道成為國內第一家提供統計機器翻譯模型的公司;2017年,有道從機器翻譯引擎升級成神經網絡翻譯引擎,隨后又升級到現在主流的Transformer技術。根據QuestMobile最新數據,到目前有道詞典月活用戶已經超過1億,排名國內詞典翻譯市場第一,也意味著這是Transformer方案下市場份額最大的翻譯產品。
技術積累的優勢首先體現在團隊的快速成型上,“有道做大模型的過程,其實完全是在之前團隊框架下來做的,沒有額外組建團隊來做,因為很多技術和資源都是一脈相承的。”網易有道首席科學家段亦濤告訴《中國企業家》。
從2016年開始,有道協同構建AI基礎能力,同步組建語言、視覺、聲音等團隊,目前積累了有道神經網絡翻譯(NMT)、計算機視覺、智能語音AI技術、高性能計算(HPC)四大底層技術能力。
2017年開始,有道升級到主流技術Transformer后,將AI能力統一在大模型之下,并重視其在端側的落地應用。2019年,有道詞典筆2代首次搭載離線Transformer NMT,將Transformer裝到詞典筆這樣的小設備里面。
因此,技術積累的優勢還體現在,過往的技術工程經驗,讓團隊在處理大模型帶來的算力、成本等難題時,能稍顯從容一些。周楓回憶,當時神經網絡的翻譯上線時,團隊碰到技術升級和成本問題完全一樣,當時花了三個多月時間才把這些問題解決掉。
過去6年多時間,有道技術團隊除了將Transformer用在翻譯產品外,也將其用在語音、視覺、OCR字符文字識別上,因此有道的算法團隊對于這次大模型的技術變化并不陌生,甚至曾試用過GPT-2的技術,到ChatGPT3.5之后,大模型帶來很多不一樣的東西,如參數規模、技術做法上的差異,但段亦濤認為總體技術路線是一脈相承的。
“很多時候成本挑戰是一個相對的過程,你如果能做到行業內對資金利用率、對人員利用率比較高的話,其實就完全沒問題的。有道總體上不需要增加什么額外的特別大的投入,因為有道AI團隊也不小。”周楓告訴《中國企業家》。
大模型帶給教育從業者的挑戰
大部分人沉浸在大模型給教育場景帶來新變化的同時,也有一部分擔心這會對從業者帶來一定的沖擊和挑戰,尤其像Hi Echo這樣的虛擬口語教練,是否會導致一部分老師失業?
虛擬口語教練。來源:受訪者
周楓認為,對英語教學團隊來說會是一個巨大的好消息,雖然他們可能三個月之后才能認知到。因為教育最大的挑戰就是因為人力不足,所以才導致無法真正做到對每一個學生因材施教,只是,未來老師們的教法必然要改變。
“以前老師的教法是告訴學生技巧,學生聽老師說,回家自己練,老師設計一套方法要求你一定自己練,不練就懲罰你。現在老師有這樣更好的產品,可能教學方法就要變,老師沒有必要講這些抽象的東西,就應該讓學生每天去練就行了,老師們需要適應這樣的技術,最后帶來的一定是生產力和效益的大幅提升。”周楓表示。
還有人擔心大模型驅動的教育應用是否會變成新的抄作業工具,讓學生變得懶于思考。
周楓表示,有道在自己的產品中反復強調不直接給答案,且有家長管控功能。他覺得當下更值得考慮的另外一個問題是,大模型誕生之后對于學生長遠的學習方式和目標,肯定會產生深遠的影響,就像有了計算器之后,對學生計算能力的影響。大模型必然會對死記硬背的知識性學習的要求降低,不是把“偷懶”作為一種產品需求。
過去半年多時間,周楓帶領團隊一直在拼命趕工,大家都處于比較緊張的狀態。在大模型到來之后,周楓真正欣慰的是,當它應用到教育領域后,相比上一輪AI熱潮,大模型給了很多承諾,起碼能實現50%,甚至更多。
比如作文其實一直是學習中的痛點,但原來能夠解決作文類型的產品非常少,很多學生也比較怕寫作文,以前的技術手段也不太管用。可在大模型基礎上,作文也是一個非常好的應用場景。
教育從來都是一個極度復雜和碎片化的領域,深耕10多年,周楓已然習慣了這種復雜性。“生意上沒有一勞永逸的事。”
- 推薦
- 新聞
- IT/互聯網
- CIO
- CDO
- IT
推薦
-
一年一度的中國數字化年會將于11月28日-30日再次攜手成都,為數字化轉型決策者們打造一場不可錯過的年度數字化盛宴!
-
在這個日新月異的變革時代,我們將于11月28日-30日在成都舉辦“2024中國數字化年會”,匯聚行業精英與各界力量,共同探討數字化時代下的轉型策略與路徑。
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
我要評論