中文字幕视频精品一区二区三区,高清国产mv视频在线观看

APP下載

掃一掃

下載觀察者APP

騰訊吳運聲：大模型訓(xùn)練正在簡化，一張照片就能生成數(shù)智人
- 周毅是故意的還是不小心？
分享到：

2024-07-08 13:36:45 字號：A- A A+ 來源：觀察者網(wǎng)

最后更新: 2025-01-21 12:58:14

以下為本次演講全文：

尊敬的各位嘉賓、媒體朋友們，大家好，歡迎來到騰訊論壇！

我是騰訊的吳運聲，今天我想和大家分享下大模型等技術(shù)的發(fā)展，以及如何更快、更好地普惠給更多人。

作為國內(nèi)規(guī)格最高、影響力最大的技術(shù)盛會，世界人工智能大會已經(jīng)連續(xù)舉辦七屆，很多新的技術(shù)趨勢、創(chuàng)新方案、產(chǎn)業(yè)成果在這里發(fā)布，已經(jīng)成為人工智能技術(shù)發(fā)展的風(fēng)向標(biāo)。

接下來，我將從技術(shù)的發(fā)展、模型的迭代、工具的優(yōu)化以及場景的落地四個層面來分享下我們的一些思考和實踐。

在技術(shù)的發(fā)展這塊，有三個趨勢想和大家分享一下。

過去一段時間，大模型的發(fā)展，將人工智能技術(shù)推到了一個新的制高點。但在實際落地中，我們發(fā)現(xiàn)，雖然單模態(tài)技術(shù)在某些場景下表現(xiàn)良好，但通過引入多模態(tài)能力，我們能夠擴展其應(yīng)用范圍，使其在更廣泛的場景中同樣表現(xiàn)出色。

比如在識別和交互上，多模態(tài)大模型通過結(jié)合視覺與語言理解等能力，有效突破了此前的局限，實現(xiàn)了更精準(zhǔn)的語義分析和全面的原因歸因。在實際場景中，這種技術(shù)能夠處理多樣化的用戶輸入，如文字、圖片等，尤其在汽車助手等企業(yè)知識服務(wù)等領(lǐng)域，提供了更深入的圖像內(nèi)容理解和更高質(zhì)量的交互體驗。

其次，在學(xué)習(xí)范式方面，傳統(tǒng)模型訓(xùn)練受限于任務(wù)獨立性，和對大量標(biāo)注數(shù)據(jù)的依賴，而通過零樣本/小樣本學(xué)習(xí)能夠很好地解決這類問題，簡化研發(fā)流程并加速AI技術(shù)的普惠。

舉個例子，以前我們?nèi)绻胍梢粋€數(shù)智人，必須錄制一段視頻，做一些高定制化的工作才能得以實現(xiàn)。而今天，利用zero-shot生成技術(shù)，僅需一張照片，無需任何定制，就可以得到一個栩栩如生的數(shù)智人。

而這個技術(shù)應(yīng)用到工業(yè)質(zhì)檢等場景中，通過一個缺陷詞匯提示或一張缺陷圖片提示，即可實現(xiàn)缺陷質(zhì)檢，能夠大大提高檢測效率和準(zhǔn)確性。比如，我們?yōu)槟除堫^新能源企業(yè)提供電池自動檢測機，解決質(zhì)檢難題。項目上線后，顯著提高了產(chǎn)品檢測能力，大大降低了該用戶的企業(yè)運營成本。

第三，在內(nèi)容呈現(xiàn)方面，隨著3D生成和視頻生成技術(shù)的不斷發(fā)展，用戶可以獲得更加沉浸式的體驗。

比如，3D生成技術(shù)通過模型不斷自學(xué)習(xí)，不再依賴人工調(diào)參，能夠打破傳統(tǒng)物理仿真的局限性，顯著提升生成內(nèi)容的速度和質(zhì)量。更豐富的3D生成內(nèi)容能夠為用戶帶來更加生動和真實的沉浸式體驗，比如單圖3D頭像生成等能力，能夠廣泛應(yīng)用于電影動畫、增強現(xiàn)實、虛擬現(xiàn)實和視頻游戲等領(lǐng)域。

與此同時，視頻生成技術(shù)也在不斷進(jìn)化，生成時長大幅增加的同時，品質(zhì)也得到了有效提升。比如，我們聯(lián)合《人民日報》打造的原創(chuàng)視頻《珍AI地球》，生成的視頻內(nèi)容真實、精細(xì)，在內(nèi)容理解、邏輯推理和畫面生成等方面表現(xiàn)都很不錯。

底層技術(shù)的不斷探索，也讓我們的模型不斷進(jìn)化。去年9月，騰訊發(fā)布了全鏈路自研的騰訊混元大模型。目前，騰訊混元大模型已經(jīng)實現(xiàn)了較大的升級，架構(gòu)也從稠密模型轉(zhuǎn)為MoE（混合專家模型），模型參數(shù)達(dá)到萬億級別，預(yù)訓(xùn)練語料超過7萬億tokens。綜合算力、工程和算法上的自研創(chuàng)新，騰訊混元大模型已經(jīng)穩(wěn)居國內(nèi)大模型第一梯隊?；煸纳鷪D、生視頻、生3D等多模態(tài)能力也處于業(yè)界領(lǐng)先地位。

目前，騰訊混元大模型的單日調(diào)用Tokens已經(jīng)達(dá)到千億級別。此前，我們也在騰訊云上開放了括混元-pro、混元-standard、混元-lite和混元standard 256k版本。

接下來，我們的混元-lite 256k版本以及vision多模態(tài)版本也會跟大家見面。同時，我們也將陸續(xù)上線代碼生成、角色扮演、functioncall等子模型和接口，滿足不同企業(yè)和開發(fā)者的需求。

具體到模型工具產(chǎn)品方面，大模型的研發(fā)、應(yīng)用必須關(guān)注、解決具體業(yè)務(wù)場景，必須關(guān)注可用性和性價比。今年5月，我們推出了3個大模型PaaS產(chǎn)品：知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎，希望能夠簡化數(shù)據(jù)工程和模型精調(diào)流程，幫助企業(yè)快速、輕松打造AI原生應(yīng)用。

經(jīng)過兩個月時間的迭代，我們的這三款模型產(chǎn)品也進(jìn)行了全新的能力提升。

首先是知識引擎，基于LLM+ RAG框架，我們發(fā)布了全新的多模態(tài)檢索能力，升級支持圖文互搜、以圖搜圖，能夠結(jié)合知識庫中檢索返回的圖文片段，給出圖文并茂的答案。

同時，我們進(jìn)一步擴展了企業(yè)知識類型覆蓋面，升級了泛BI對話式數(shù)據(jù)問答體驗，支持超大表格、多表場景的多步驟推理、多條件篩選、求和計算，可擴展支持對接客戶主流數(shù)據(jù)庫。

圖像創(chuàng)作引擎這里，我們基于騰訊混元模型底座，實現(xiàn)了業(yè)界領(lǐng)先的AI圖像生成和編輯能力。我們的圖像風(fēng)格目前已經(jīng)新增到33種，并推出了專用于頭像的生成模式，讓生成的風(fēng)格化頭像既能保留個人相貌特色，又融入了多元藝術(shù)風(fēng)格特征。同時還新增了商品背景生成、模特?fù)Q裝和創(chuàng)意換裝等接口，大幅降低了營銷和影視行業(yè)的制作成本。

而視頻創(chuàng)作引擎這一次也進(jìn)行了全新升級，帶來了不少好用、實用的功能體驗。首先，我們新增了超過20種熱門舞蹈動作，利用先進(jìn)的3D建模技術(shù)和背部生成技術(shù)，使得圖片中的角色能夠非常流暢地進(jìn)行轉(zhuǎn)身舞蹈，甚至支持多人舞蹈的復(fù)雜編排，這在行業(yè)內(nèi)屬于首創(chuàng)。

其次，我們的視頻風(fēng)格化功能借助面部增強技術(shù)，能夠逼真還原面部細(xì)節(jié)與表情，這在行業(yè)里也是比較領(lǐng)先的。另外，我們的視頻轉(zhuǎn)譯功能接入混元文生文大模型和TTS技術(shù)，也能大幅提升轉(zhuǎn)譯后音頻的自然度、相似度和語速效果。這些能力的升級既能增強視頻創(chuàng)作多樣性和表現(xiàn)力，也能為創(chuàng)作者拓展更大的創(chuàng)意空間。

同時，為了幫助企業(yè)用戶更便捷地打造專屬的模型應(yīng)用，我們的機器學(xué)習(xí)平臺TI平臺也進(jìn)行了全新升級。

首先，我們內(nèi)置了開源可擴展的數(shù)據(jù)構(gòu)建pipeline，能夠幫助開發(fā)者高效進(jìn)行數(shù)據(jù)準(zhǔn)備。另外，我們還全面提升了數(shù)據(jù)標(biāo)注能力，首創(chuàng)了基于Schema的標(biāo)注方法，專為LLM和多模態(tài)大模型設(shè)計，非常靈活、好用。

平臺的精調(diào)訓(xùn)練模塊以易用、穩(wěn)定和高效為核心，內(nèi)置多款主流大模型，支持一鍵啟動精調(diào)，并通過三層穩(wěn)定機制及自研Angel框架，確保大規(guī)模訓(xùn)練的連續(xù)性和性能提升。此外，我們還采用三階段模型評測流程，包括輕量體驗、客觀評測和主觀評測，確保模型訓(xùn)練的精準(zhǔn)性和真實反饋。

通過混元大模型底座、TI平臺、知識引擎等工具、產(chǎn)品的不斷迭代與發(fā)展，目前我們能夠圍繞辦公協(xié)同、知識管理、智能客服、營銷等全場景，為產(chǎn)業(yè)用戶提供全鏈路模型服務(wù)，幫助他們真正實現(xiàn)提質(zhì)增效和轉(zhuǎn)型升級。

比如，我們將知識引擎的能力應(yīng)用于企點客服大模型文本機器人。在面向賬單查詢、退換貨這類復(fù)雜任務(wù)時，大模型機器人配置成本，相較傳統(tǒng)文本機器人減少50%。

再比如，騰訊樂享是服務(wù)于企業(yè)內(nèi)部的知識學(xué)習(xí)協(xié)作平臺，為企業(yè)提供知識管理、學(xué)習(xí)培訓(xùn)、文化建設(shè)等服務(wù)，目前已經(jīng)服務(wù)了超過30萬家客戶，用戶超過1億。在結(jié)合騰訊自研大模型和知識引擎后，樂享實現(xiàn)了兩大場景的關(guān)鍵革新。

圍繞“知識生產(chǎn)端”，樂享結(jié)合大模型知識引擎，升級了“智能寫作”能力，一句話就讓AI幫你完成寫作?！爸悄苌伞保梢宰孉I自動生成知識點、生成考題，解決了培訓(xùn)部門不懂業(yè)務(wù)、業(yè)務(wù)部門不懂培訓(xùn)的難題，提升培訓(xùn)效率。

圍繞“知識消費端“，還推出”智能問答“，無需訓(xùn)練即可讓AI回答內(nèi)部業(yè)務(wù)知識，大幅提升知識獲取效率，又繼承了每個文檔的細(xì)分權(quán)限，做到千人千面的問答。比如，一個擁有薪酬權(quán)限的員工問“薪酬怎么算”，AI會給出詳細(xì)回答，一個沒有權(quán)限的員工問，AI則回答“抱歉，不清楚”。

在產(chǎn)業(yè)落地方面，本著優(yōu)勢互補的原則，我們和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心開展合作，共研醫(yī)學(xué)大模型，目前在瑞金醫(yī)院實現(xiàn)了總檢報告和電子病歷生成等相關(guān)項目的落地應(yīng)用。以體檢報告生成為例，平均每5秒即可自動生成一份總檢報告，為醫(yī)生節(jié)約50%+的撰寫時間。

在文娛行業(yè)，閱文集團(tuán)已經(jīng)應(yīng)用大模型文生文能力，為作家提供AI輔助寫作能力，包括描寫靈感、大綱提取和角色提取等；應(yīng)用大模型文生圖能力，用于連載書插圖制作等內(nèi)容。

但與此同時，他們也遇到了一些模型應(yīng)用難題，一來算法和工程團(tuán)隊精力有限，模型數(shù)量多迭代快，自行搭建推理集群和服務(wù)平臺，模型更新復(fù)雜；二來推理成本高昂，推理速度已達(dá)瓶頸，千百億級別模型推理部署，推理吞吐和時延存在瓶頸。

而通過騰訊云TI平臺的應(yīng)用，在模型訓(xùn)練方面，有效降低了訓(xùn)練配置難度。以前更多是通過編寫代碼等復(fù)雜配置去提交對應(yīng)訓(xùn)練任務(wù)，做任務(wù)管理；現(xiàn)在只需要在TI平臺上做一些點選的工作，就可以快速開啟訓(xùn)練任務(wù)；在模型推理方面，通過我們的平臺加速框架，幫助閱文實現(xiàn)了在相同資源條件下，內(nèi)容產(chǎn)出的速度變得更快；另外，平臺還提供了直觀的監(jiān)控和管理工具，幫助客戶輕松管理任務(wù)和資源。

產(chǎn)業(yè)落地之外，我們也看到大模型在科學(xué)計算、文化研究方面的價值。2021年，我們聯(lián)合國家天文臺，發(fā)起了“探星計劃”，我們希望通過人工智能技術(shù)，提升天文發(fā)現(xiàn)和科研的效率。

截至目前，通過我們的AI技術(shù)助力，從巡天觀測數(shù)據(jù)中發(fā)現(xiàn)了3顆快速射電暴、41顆脈沖星?？焖偕潆姳┦悄壳疤煳慕缪芯繜狳c，相比脈沖星，快速射電暴因發(fā)現(xiàn)時間晚、AI訓(xùn)練數(shù)據(jù)少、出現(xiàn)頻率低，發(fā)現(xiàn)難度相比脈沖星要大很多。為此，我們團(tuán)隊通過設(shè)計全新的端到端AI算法，引入多示例學(xué)習(xí)和大模型注意力機制，顯著提升了模型精度和數(shù)據(jù)處理速度。

在文化領(lǐng)域，此前我們與內(nèi)外部多個部門攜手合作，將文字檢測、摹本生成、字形匹配等多種AI算法，綜合應(yīng)用于甲骨文研究。今天，我也宣布將全球最大的甲骨文多模態(tài)數(shù)據(jù)集正式開源。該數(shù)據(jù)集包含一萬片甲骨的拓片、摹本，以及甲骨單字對應(yīng)位置、對應(yīng)字頭、對應(yīng)釋文以及辭例分組、釋讀順序等數(shù)據(jù)。

基于該數(shù)據(jù)集，研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法，助推甲骨文研究加速數(shù)字化和智能化。

最后，無論是產(chǎn)業(yè)落地還是科學(xué)、文化探索，AI大模型技術(shù)的發(fā)展離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建。后續(xù)，我也希望能夠與更多同行者一道，推進(jìn)科技賦能與產(chǎn)業(yè)創(chuàng)新，共創(chuàng)、共建、共享智能美好未來，謝謝大家。

本文系觀察者網(wǎng)獨家稿件，未經(jīng)授權(quán)，不得轉(zhuǎn)載。

首頁上一頁 1 2 余下全文
|

舉報
- 違反法律法規(guī)
- 垃圾信息、廣告
- 色情、淫穢信息
- 人身攻擊
- 謠言、不實信息
- 冒充，冒用信息
- 破壞社區(qū)秩序
- 其他
- 涉未成年人有害信息
觀察者網(wǎng)舉報制度規(guī)范
確定取消
標(biāo)簽騰訊 2024世界人工智能大會
- 責(zé)任編輯: 周毅
- 羅曉任中國商飛黨委副書記、董事
  
  2025-01-20 21:01 大公司
- 黃仁勛現(xiàn)身北京，稱華為三折疊“難以置信”
  
  2025-01-20 18:15 觀網(wǎng)財經(jīng)-科創(chuàng)
- 榮耀中國區(qū)CMO將離職
  
  2025-01-20 16:32 觀網(wǎng)財經(jīng)-科創(chuàng)
- 前華為悍將掛帥，榮耀劍指高端化和全球化
  
  2025-01-20 15:15 觀網(wǎng)財經(jīng)-科創(chuàng)
- 中國折疊屏市場罕見下滑，華為榮耀vivo位列去年前三
  
  2025-01-20 14:10 觀網(wǎng)財經(jīng)-科創(chuàng)
- 華為2024年分紅方案公布，收益率18%
  
  2025-01-20 10:11 觀網(wǎng)財經(jīng)-科創(chuàng)
- 事關(guān)國補！蘋果華為等多款手機降價至6000元以下
  
  2025-01-20 09:43 觀網(wǎng)財經(jīng)-科創(chuàng)
- TikTok向美國用戶推送暫停服務(wù)通知
  
  2025-01-19 10:57 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
- 馬斯克要收購英特爾？
  
  2025-01-18 14:48 觀網(wǎng)財經(jīng)-科創(chuàng)
- 荷蘭決定“隱藏”光刻機巨頭對華銷售情況
  
  2025-01-18 13:24 觀網(wǎng)財經(jīng)-科創(chuàng)
- 龍芯中科去年凈利大跌88%，預(yù)虧超6億
  
  2025-01-18 09:57 觀網(wǎng)財經(jīng)-科創(chuàng)
- 日本壓上國運的氫能源，出路只能在中國？
  
  2025-01-17 18:48 觀察者頭條
- 美企獲巨額補貼低價對華出口芯片，中方將依法啟動調(diào)查
  
  2025-01-17 18:27 觀網(wǎng)財經(jīng)-科創(chuàng)
- 黃仁勛忙著訪問中國，將缺席特朗普就職典禮
  
  2025-01-17 18:07 觀網(wǎng)財經(jīng)-科創(chuàng)
- 趙明辭任榮耀CEO：人生最艱難的決定
  
  2025-01-17 17:18 觀網(wǎng)財經(jīng)-科創(chuàng)
- 采礦業(yè)史上最大并購案要來了？傳力拓與嘉能可已初步談判
  
  2025-01-17 15:26 產(chǎn)業(yè)萬象
- 淘寶已成為2025年春晚獨家電商互動平臺
  
  2025-01-17 14:30 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng)
- 國家統(tǒng)計局公布去年12月70城房價，新房環(huán)比漲價城市增加至23個
  
  2025-01-17 14:18
- 未來變成美積電？臺積電董事長稱“門都沒有”
  
  2025-01-17 11:36 觀網(wǎng)財經(jīng)-科創(chuàng)
- 2024年全國固投增長3.2%，外企投資下降10%
  
  2025-01-17 10:50 中國經(jīng)濟
搜索

   觀察者頭條查看全部

“斷供”陰影下，國產(chǎn)操作系統(tǒng)的破局時刻評論 25

“印巴沖突是敘事之戰(zhàn)，中國裝備重要性凸顯” 評論 152

特朗普故弄玄虛稱“和某大國達(dá)成協(xié)議”，就這？評論 160

巴外長證實：殲-10擊落印軍“陣風(fēng)” 評論 714

美財長：這些嬰童用品從中國進(jìn)口，考慮降稅評論 159

   風(fēng)聞 · 24小時最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

騰訊吳運聲：大模型訓(xùn)練正在簡化，一張照片就能生成數(shù)智人

羅曉任中國商飛黨委副書記、董事

黃仁勛現(xiàn)身北京，稱華為三折疊“難以置信”

榮耀中國區(qū)CMO將離職

前華為悍將掛帥，榮耀劍指高端化和全球化

中國折疊屏市場罕見下滑，華為榮耀vivo位列去年前三

華為2024年分紅方案公布，收益率18%

事關(guān)國補！蘋果華為等多款手機降價至6000元以下

TikTok向美國用戶推送暫停服務(wù)通知

馬斯克要收購英特爾？

荷蘭決定“隱藏”光刻機巨頭對華銷售情況

龍芯中科去年凈利大跌88%，預(yù)虧超6億

日本壓上國運的氫能源，出路只能在中國？

美企獲巨額補貼低價對華出口芯片，中方將依法啟動調(diào)查

黃仁勛忙著訪問中國，將缺席特朗普就職典禮

趙明辭任榮耀CEO：人生最艱難的決定

采礦業(yè)史上最大并購案要來了？傳力拓與嘉能可已初步談判

淘寶已成為2025年春晚獨家電商互動平臺

國家統(tǒng)計局公布去年12月70城房價，新房環(huán)比漲價城市增加至23個

未來變成美積電？臺積電董事長稱“門都沒有”

2024年全國固投增長3.2%，外企投資下降10%

100多架飛機大戰(zhàn)后，印巴局勢怎么走？

美國又炒作，我駐古巴大使發(fā)文駁斥

美英談成了，“英國讓步”

沖突愈演愈烈，莫迪首發(fā)聲

“美國在歐洲的廣泛軍事存在并不是必然的"

印度兩座水電站已重新開閘

“印巴沖突是敘事之戰(zhàn)，中國裝備重要性凸顯”

夸大對華關(guān)稅效果，她被打假了

突發(fā)！巴稱擊斃約50名印士兵，印稱摧毀巴第二大城市防空系統(tǒng)

彈射座椅大廠泄露了印巴空戰(zhàn)戰(zhàn)損“天機”？

巴總理：關(guān)鍵時刻，感謝“親愛的兄弟”埃爾多安

日本地鐵出現(xiàn)隨機殺人事件，男子揮20厘米菜刀砍傷2人

“斯洛伐克幾分鐘前才被通知…現(xiàn)在知道國際政治是啥了吧”

“俄羅斯要價太高，但...”

烏克蘭議會批準(zhǔn)美烏礦產(chǎn)協(xié)議

“特朗普稱要把這改叫阿拉伯灣”，伊朗譴責(zé)：我們也沒反對阿拉伯海