-
騰訊吳運聲:大模型訓(xùn)練正在簡化,一張照片就能生成數(shù)智人
-
周毅是故意的還是不小心?
最后更新: 2025-01-21 12:58:14以下為本次演講全文:
尊敬的各位嘉賓、媒體朋友們,大家好,歡迎來到騰訊論壇!
我是騰訊的吳運聲,今天我想和大家分享下大模型等技術(shù)的發(fā)展,以及如何更快、更好地普惠給更多人。
作為國內(nèi)規(guī)格最高、影響力最大的技術(shù)盛會,世界人工智能大會已經(jīng)連續(xù)舉辦七屆,很多新的技術(shù)趨勢、創(chuàng)新方案、產(chǎn)業(yè)成果在這里發(fā)布,已經(jīng)成為人工智能技術(shù)發(fā)展的風(fēng)向標(biāo)。
接下來,我將從技術(shù)的發(fā)展、模型的迭代、工具的優(yōu)化以及場景的落地四個層面來分享下我們的一些思考和實踐。
在技術(shù)的發(fā)展這塊,有三個趨勢想和大家分享一下。
過去一段時間,大模型的發(fā)展,將人工智能技術(shù)推到了一個新的制高點。但在實際落地中,我們發(fā)現(xiàn),雖然單模態(tài)技術(shù)在某些場景下表現(xiàn)良好,但通過引入多模態(tài)能力,我們能夠擴展其應(yīng)用范圍,使其在更廣泛的場景中同樣表現(xiàn)出色。
比如在識別和交互上,多模態(tài)大模型通過結(jié)合視覺與語言理解等能力,有效突破了此前的局限,實現(xiàn)了更精準(zhǔn)的語義分析和全面的原因歸因。在實際場景中,這種技術(shù)能夠處理多樣化的用戶輸入,如文字、圖片等,尤其在汽車助手等企業(yè)知識服務(wù)等領(lǐng)域,提供了更深入的圖像內(nèi)容理解和更高質(zhì)量的交互體驗。
其次,在學(xué)習(xí)范式方面,傳統(tǒng)模型訓(xùn)練受限于任務(wù)獨立性,和對大量標(biāo)注數(shù)據(jù)的依賴,而通過零樣本/小樣本學(xué)習(xí)能夠很好地解決這類問題,簡化研發(fā)流程并加速AI技術(shù)的普惠。
舉個例子,以前我們?nèi)绻胍梢粋€數(shù)智人,必須錄制一段視頻,做一些高定制化的工作才能得以實現(xiàn)。而今天,利用zero-shot生成技術(shù),僅需一張照片,無需任何定制,就可以得到一個栩栩如生的數(shù)智人。
而這個技術(shù)應(yīng)用到工業(yè)質(zhì)檢等場景中,通過一個缺陷詞匯提示或一張缺陷圖片提示,即可實現(xiàn)缺陷質(zhì)檢,能夠大大提高檢測效率和準(zhǔn)確性。比如,我們?yōu)槟除堫^新能源企業(yè)提供電池自動檢測機,解決質(zhì)檢難題。項目上線后,顯著提高了產(chǎn)品檢測能力,大大降低了該用戶的企業(yè)運營成本。
第三,在內(nèi)容呈現(xiàn)方面,隨著3D生成和視頻生成技術(shù)的不斷發(fā)展,用戶可以獲得更加沉浸式的體驗。
比如,3D生成技術(shù)通過模型不斷自學(xué)習(xí),不再依賴人工調(diào)參,能夠打破傳統(tǒng)物理仿真的局限性,顯著提升生成內(nèi)容的速度和質(zhì)量。更豐富的3D生成內(nèi)容能夠為用戶帶來更加生動和真實的沉浸式體驗,比如單圖3D頭像生成等能力,能夠廣泛應(yīng)用于電影動畫、增強現(xiàn)實、虛擬現(xiàn)實和視頻游戲等領(lǐng)域。
與此同時,視頻生成技術(shù)也在不斷進(jìn)化,生成時長大幅增加的同時,品質(zhì)也得到了有效提升。比如,我們聯(lián)合《人民日報》打造的原創(chuàng)視頻《珍AI地球》,生成的視頻內(nèi)容真實、精細(xì),在內(nèi)容理解、邏輯推理和畫面生成等方面表現(xiàn)都很不錯。
底層技術(shù)的不斷探索,也讓我們的模型不斷進(jìn)化。去年9月,騰訊發(fā)布了全鏈路自研的騰訊混元大模型。目前,騰訊混元大模型已經(jīng)實現(xiàn)了較大的升級,架構(gòu)也從稠密模型轉(zhuǎn)為MoE(混合專家模型),模型參數(shù)達(dá)到萬億級別,預(yù)訓(xùn)練語料超過7萬億tokens。綜合算力、工程和算法上的自研創(chuàng)新,騰訊混元大模型已經(jīng)穩(wěn)居國內(nèi)大模型第一梯隊?;煸纳鷪D、生視頻、生3D等多模態(tài)能力也處于業(yè)界領(lǐng)先地位。
目前,騰訊混元大模型的單日調(diào)用Tokens已經(jīng)達(dá)到千億級別。此前,我們也在騰訊云上開放了括混元-pro、混元-standard、混元-lite和混元standard 256k版本。
接下來,我們的混元-lite 256k版本以及vision多模態(tài)版本也會跟大家見面。同時,我們也將陸續(xù)上線代碼生成、角色扮演、functioncall等子模型和接口,滿足不同企業(yè)和開發(fā)者的需求。
具體到模型工具產(chǎn)品方面,大模型的研發(fā)、應(yīng)用必須關(guān)注、解決具體業(yè)務(wù)場景,必須關(guān)注可用性和性價比。今年5月,我們推出了3個大模型PaaS產(chǎn)品:知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎,希望能夠簡化數(shù)據(jù)工程和模型精調(diào)流程,幫助企業(yè)快速、輕松打造AI原生應(yīng)用。
經(jīng)過兩個月時間的迭代,我們的這三款模型產(chǎn)品也進(jìn)行了全新的能力提升。
首先是知識引擎,基于LLM+ RAG框架,我們發(fā)布了全新的多模態(tài)檢索能力,升級支持圖文互搜、以圖搜圖,能夠結(jié)合知識庫中檢索返回的圖文片段,給出圖文并茂的答案。
同時,我們進(jìn)一步擴展了企業(yè)知識類型覆蓋面,升級了泛BI對話式數(shù)據(jù)問答體驗,支持超大表格、多表場景的多步驟推理、多條件篩選、求和計算,可擴展支持對接客戶主流數(shù)據(jù)庫。
圖像創(chuàng)作引擎這里,我們基于騰訊混元模型底座,實現(xiàn)了業(yè)界領(lǐng)先的AI圖像生成和編輯能力。我們的圖像風(fēng)格目前已經(jīng)新增到33種,并推出了專用于頭像的生成模式,讓生成的風(fēng)格化頭像既能保留個人相貌特色,又融入了多元藝術(shù)風(fēng)格特征。同時還新增了商品背景生成、模特?fù)Q裝和創(chuàng)意換裝等接口,大幅降低了營銷和影視行業(yè)的制作成本。
而視頻創(chuàng)作引擎這一次也進(jìn)行了全新升級,帶來了不少好用、實用的功能體驗。首先,我們新增了超過20種熱門舞蹈動作,利用先進(jìn)的3D建模技術(shù)和背部生成技術(shù),使得圖片中的角色能夠非常流暢地進(jìn)行轉(zhuǎn)身舞蹈,甚至支持多人舞蹈的復(fù)雜編排,這在行業(yè)內(nèi)屬于首創(chuàng)。
其次,我們的視頻風(fēng)格化功能借助面部增強技術(shù),能夠逼真還原面部細(xì)節(jié)與表情,這在行業(yè)里也是比較領(lǐng)先的。另外,我們的視頻轉(zhuǎn)譯功能接入混元文生文大模型和TTS技術(shù),也能大幅提升轉(zhuǎn)譯后音頻的自然度、相似度和語速效果。這些能力的升級既能增強視頻創(chuàng)作多樣性和表現(xiàn)力,也能為創(chuàng)作者拓展更大的創(chuàng)意空間。
同時,為了幫助企業(yè)用戶更便捷地打造專屬的模型應(yīng)用,我們的機器學(xué)習(xí)平臺TI平臺也進(jìn)行了全新升級。
首先,我們內(nèi)置了開源可擴展的數(shù)據(jù)構(gòu)建pipeline,能夠幫助開發(fā)者高效進(jìn)行數(shù)據(jù)準(zhǔn)備。另外,我們還全面提升了數(shù)據(jù)標(biāo)注能力,首創(chuàng)了基于Schema的標(biāo)注方法,專為LLM和多模態(tài)大模型設(shè)計,非常靈活、好用。
平臺的精調(diào)訓(xùn)練模塊以易用、穩(wěn)定和高效為核心,內(nèi)置多款主流大模型,支持一鍵啟動精調(diào),并通過三層穩(wěn)定機制及自研Angel框架,確保大規(guī)模訓(xùn)練的連續(xù)性和性能提升。此外,我們還采用三階段模型評測流程,包括輕量體驗、客觀評測和主觀評測,確保模型訓(xùn)練的精準(zhǔn)性和真實反饋。
通過混元大模型底座、TI平臺、知識引擎等工具、產(chǎn)品的不斷迭代與發(fā)展,目前我們能夠圍繞辦公協(xié)同、知識管理、智能客服、營銷等全場景,為產(chǎn)業(yè)用戶提供全鏈路模型服務(wù),幫助他們真正實現(xiàn)提質(zhì)增效和轉(zhuǎn)型升級。
比如,我們將知識引擎的能力應(yīng)用于企點客服大模型文本機器人。在面向賬單查詢、退換貨這類復(fù)雜任務(wù)時,大模型機器人配置成本,相較傳統(tǒng)文本機器人減少50%。
再比如,騰訊樂享是服務(wù)于企業(yè)內(nèi)部的知識學(xué)習(xí)協(xié)作平臺,為企業(yè)提供知識管理、學(xué)習(xí)培訓(xùn)、文化建設(shè)等服務(wù),目前已經(jīng)服務(wù)了超過30萬家客戶,用戶超過1億。在結(jié)合騰訊自研大模型和知識引擎后,樂享實現(xiàn)了兩大場景的關(guān)鍵革新。
圍繞“知識生產(chǎn)端”,樂享結(jié)合大模型知識引擎,升級了“智能寫作”能力,一句話就讓AI幫你完成寫作?!爸悄苌伞保梢宰孉I自動生成知識點、生成考題,解決了培訓(xùn)部門不懂業(yè)務(wù)、業(yè)務(wù)部門不懂培訓(xùn)的難題,提升培訓(xùn)效率。
圍繞“知識消費端“,還推出”智能問答“,無需訓(xùn)練即可讓AI回答內(nèi)部業(yè)務(wù)知識,大幅提升知識獲取效率,又繼承了每個文檔的細(xì)分權(quán)限,做到千人千面的問答。比如,一個擁有薪酬權(quán)限的員工問“薪酬怎么算”,AI會給出詳細(xì)回答,一個沒有權(quán)限的員工問,AI則回答“抱歉,不清楚”。
在產(chǎn)業(yè)落地方面,本著優(yōu)勢互補的原則,我們和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心開展合作,共研醫(yī)學(xué)大模型,目前在瑞金醫(yī)院實現(xiàn)了總檢報告和電子病歷生成等相關(guān)項目的落地應(yīng)用。以體檢報告生成為例,平均每5秒即可自動生成一份總檢報告,為醫(yī)生節(jié)約50%+的撰寫時間。
在文娛行業(yè),閱文集團(tuán)已經(jīng)應(yīng)用大模型文生文能力,為作家提供AI輔助寫作能力,包括描寫靈感、大綱提取和角色提取等;應(yīng)用大模型文生圖能力,用于連載書插圖制作等內(nèi)容。
但與此同時,他們也遇到了一些模型應(yīng)用難題,一來算法和工程團(tuán)隊精力有限,模型數(shù)量多迭代快,自行搭建推理集群和服務(wù)平臺,模型更新復(fù)雜;二來推理成本高昂,推理速度已達(dá)瓶頸,千百億級別模型推理部署,推理吞吐和時延存在瓶頸。
而通過騰訊云TI平臺的應(yīng)用,在模型訓(xùn)練方面,有效降低了訓(xùn)練配置難度。以前更多是通過編寫代碼等復(fù)雜配置去提交對應(yīng)訓(xùn)練任務(wù),做任務(wù)管理;現(xiàn)在只需要在TI平臺上做一些點選的工作,就可以快速開啟訓(xùn)練任務(wù);在模型推理方面,通過我們的平臺加速框架,幫助閱文實現(xiàn)了在相同資源條件下,內(nèi)容產(chǎn)出的速度變得更快;另外,平臺還提供了直觀的監(jiān)控和管理工具,幫助客戶輕松管理任務(wù)和資源。
產(chǎn)業(yè)落地之外,我們也看到大模型在科學(xué)計算、文化研究方面的價值。2021年,我們聯(lián)合國家天文臺,發(fā)起了“探星計劃”,我們希望通過人工智能技術(shù),提升天文發(fā)現(xiàn)和科研的效率。
截至目前,通過我們的AI技術(shù)助力,從巡天觀測數(shù)據(jù)中發(fā)現(xiàn)了3顆快速射電暴、41顆脈沖星??焖偕潆姳┦悄壳疤煳慕缪芯繜狳c,相比脈沖星,快速射電暴因發(fā)現(xiàn)時間晚、AI訓(xùn)練數(shù)據(jù)少、出現(xiàn)頻率低,發(fā)現(xiàn)難度相比脈沖星要大很多。為此,我們團(tuán)隊通過設(shè)計全新的端到端AI算法,引入多示例學(xué)習(xí)和大模型注意力機制,顯著提升了模型精度和數(shù)據(jù)處理速度。
在文化領(lǐng)域,此前我們與內(nèi)外部多個部門攜手合作,將文字檢測、摹本生成、字形匹配等多種AI算法,綜合應(yīng)用于甲骨文研究。今天,我也宣布將全球最大的甲骨文多模態(tài)數(shù)據(jù)集正式開源。該數(shù)據(jù)集包含一萬片甲骨的拓片、摹本,以及甲骨單字對應(yīng)位置、對應(yīng)字頭、對應(yīng)釋文以及辭例分組、釋讀順序等數(shù)據(jù)。
基于該數(shù)據(jù)集,研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數(shù)字化和智能化。
最后,無論是產(chǎn)業(yè)落地還是科學(xué)、文化探索,AI大模型技術(shù)的發(fā)展離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建。后續(xù),我也希望能夠與更多同行者一道,推進(jìn)科技賦能與產(chǎn)業(yè)創(chuàng)新,共創(chuàng)、共 建、共享智能美好未來,謝謝大家。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 周毅 
-
羅曉任中國商飛黨委副書記、董事
2025-01-20 21:01 大公司 -
黃仁勛現(xiàn)身北京,稱華為三折疊“難以置信”
2025-01-20 18:15 觀網(wǎng)財經(jīng)-科創(chuàng) -
榮耀中國區(qū)CMO將離職
2025-01-20 16:32 觀網(wǎng)財經(jīng)-科創(chuàng) -
前華為悍將掛帥,榮耀劍指高端化和全球化
2025-01-20 15:15 觀網(wǎng)財經(jīng)-科創(chuàng) -
中國折疊屏市場罕見下滑,華為榮耀vivo位列去年前三
2025-01-20 14:10 觀網(wǎng)財經(jīng)-科創(chuàng) -
華為2024年分紅方案公布,收益率18%
2025-01-20 10:11 觀網(wǎng)財經(jīng)-科創(chuàng) -
事關(guān)國補!蘋果華為等多款手機降價至6000元以下
2025-01-20 09:43 觀網(wǎng)財經(jīng)-科創(chuàng) -
TikTok向美國用戶推送暫停服務(wù)通知
2025-01-19 10:57 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
馬斯克要收購英特爾?
2025-01-18 14:48 觀網(wǎng)財經(jīng)-科創(chuàng) -
荷蘭決定“隱藏”光刻機巨頭對華銷售情況
2025-01-18 13:24 觀網(wǎng)財經(jīng)-科創(chuàng) -
龍芯中科去年凈利大跌88%,預(yù)虧超6億
2025-01-18 09:57 觀網(wǎng)財經(jīng)-科創(chuàng) -
日本壓上國運的氫能源,出路只能在中國?
2025-01-17 18:48 觀察者頭條 -
美企獲巨額補貼低價對華出口芯片,中方將依法啟動調(diào)查
2025-01-17 18:27 觀網(wǎng)財經(jīng)-科創(chuàng) -
黃仁勛忙著訪問中國,將缺席特朗普就職典禮
2025-01-17 18:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
趙明辭任榮耀CEO:人生最艱難的決定
2025-01-17 17:18 觀網(wǎng)財經(jīng)-科創(chuàng) -
采礦業(yè)史上最大并購案要來了?傳力拓與嘉能可已初步談判
2025-01-17 15:26 產(chǎn)業(yè)萬象 -
淘寶已成為2025年春晚獨家電商互動平臺
2025-01-17 14:30 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
國家統(tǒng)計局公布去年12月70城房價,新房環(huán)比漲價城市增加至23個
2025-01-17 14:18 -
未來變成美積電? 臺積電董事長稱“門都沒有”
2025-01-17 11:36 觀網(wǎng)財經(jīng)-科創(chuàng) -
2024年全國固投增長3.2%,外企投資下降10%
2025-01-17 10:50 中國經(jīng)濟
相關(guān)推薦 -
-
最新聞 Hot
-
100多架飛機大戰(zhàn)后,印巴局勢怎么走?
-
美國又炒作,我駐古巴大使發(fā)文駁斥
-
美英談成了,“英國讓步”
-
沖突愈演愈烈,莫迪首發(fā)聲
-
“美國在歐洲的廣泛軍事存在并不是必然的"
-
印度兩座水電站已重新開閘
-
“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯”
-
夸大對華關(guān)稅效果,她被打假了
-
突發(fā)!巴稱擊斃約50名印士兵,印稱摧毀巴第二大城市防空系統(tǒng)
-
彈射座椅大廠泄露了印巴空戰(zhàn)戰(zhàn)損“天機”?
-
巴總理:關(guān)鍵時刻,感謝“親愛的兄弟”埃爾多安
-
日本地鐵出現(xiàn)隨機殺人事件,男子揮20厘米菜刀砍傷2人
-
“斯洛伐克幾分鐘前才被通知…現(xiàn)在知道國際政治是啥了吧”
-
“俄羅斯要價太高,但...”
-
烏克蘭議會批準(zhǔn)美烏礦產(chǎn)協(xié)議
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責(zé):我們也沒反對阿拉伯海
-