-
小紅書技術(shù)副總裁王曉博:大模型讓AI越來越像人,更懂小紅書的內(nèi)容與用戶
(觀察者網(wǎng) 訊)2024世界人工智能大會(huì)暨人工智能全球治理高級別會(huì)議7月4日-6日在上海舉行。
7月5日下午,由中國信息通信研究院承辦的WAIC 2024 “邁向AGI:大模型煥新與產(chǎn)業(yè)賦能”論壇在上海徐匯西岸拉開帷幕。小紅書技術(shù)副總裁王曉博在論壇上發(fā)表主題演講,分享了小紅書在大模型領(lǐng)域的最新布局與探索。
目前小紅書社區(qū)擁有超過三億的月活用戶,越來越多新一代年輕人因?yàn)楣餐呐d趣愛好在這里相聚,小紅書上海量的UGC構(gòu)成了一部豐富的生活指南。
在演講中,王曉博從“搜”、“推”、“創(chuàng)”、“美”、“伴”等多個(gè)技術(shù)應(yīng)用場景闡述了大模型將如何助力小紅書這本“生活指南”更便捷、更鮮活、更美好。
王曉博指出:”我們希望通過多模大模型的能力增強(qiáng),讓AI能夠越來越像人一樣,能夠理解小紅書的內(nèi)容,不僅僅可以看懂筆記,看懂圖片和文字,能夠進(jìn)行內(nèi)容的整理和問答,也能夠輔助用戶進(jìn)行更便捷的內(nèi)容創(chuàng)作,同時(shí)通過對內(nèi)容和用戶的深度理解,更好地建立內(nèi)容和用戶之間的關(guān)聯(lián)和匹配效率?!?
搜索一直是用戶在小紅書上高頻使用的功能,70%的小紅書活躍用戶有主動(dòng)搜索行為。小紅書目前正在探索將大模型引入搜索的技術(shù)鏈路,未來能夠給用戶帶來更便捷的搜索體驗(yàn)。
據(jù)王曉博介紹,在日常使用中,用戶查詢一些復(fù)雜問題時(shí),往往需要多步搜索才能獲得想要的答案。而有了大模型的加持之后,小紅書將使用Search Agent來模擬用戶的多次搜索過程,通過大模型代理用戶的查詢過程,直接交付答案給用戶,大大提升了搜索效率。
在推薦上,大模型則可以幫助小紅書更好地理解內(nèi)容和用戶興趣。王曉博表示,傳統(tǒng)推薦系統(tǒng)依賴行為數(shù)據(jù)對用戶和內(nèi)容進(jìn)行建模,會(huì)導(dǎo)致新筆記分發(fā)難,缺乏推理能力導(dǎo)致信息繭房等問題。
在小紅書的推薦系統(tǒng)中,率先將大模型作為筆記的語義編碼器來使用,通過語義壓縮提示詞(prompt)結(jié)合對比學(xué)習(xí)技術(shù),讓大模型能夠把筆記轉(zhuǎn)化為推薦系統(tǒng)可理解的向量表征,在新筆記分發(fā)上取得了非常大的提升。同時(shí),大語言模型(LLM)的推理能力能夠更好地建模用戶興趣,小紅書通過讓大模型從歷史行為中推理用戶潛在的新興趣,有效的緩解了信息繭房問題,提升了用戶留存。
AI智能創(chuàng)作同樣是小紅書與大模型擦出火花的重要探索領(lǐng)域。今年小紅書內(nèi)部孵化的創(chuàng)新項(xiàng)目InstantID,通過人臉I(yè)D注入方式,成功在技術(shù)上兼顧了風(fēng)格的保持和人臉I(yè)D的一致性,它不僅風(fēng)格多樣,同時(shí)無需模型訓(xùn)練,實(shí)現(xiàn)秒級出圖,為用戶提供了“發(fā)現(xiàn)不一樣的自己”的創(chuàng)作方式。
目前,該項(xiàng)目已向業(yè)界開源,為商業(yè)應(yīng)用如電子商務(wù)、廣告和娛樂產(chǎn)業(yè)創(chuàng)造了新的可能性。
此外,王曉博還認(rèn)為,大模型不僅可以為用戶提供信息和創(chuàng)意,也可以提供很多情緒價(jià)值。為此,小紅書在寵物世界、社區(qū)群聊、官號私信這幾個(gè)主要場景下,分別搭建了AI寵物、AI群聊、AI助手這一類聊天BOT產(chǎn)品,為用戶提供泛娛樂功能。
以AI寵物為例,每位用戶都可以領(lǐng)養(yǎng)一個(gè)虛擬寵物,通過對話的方式與它交互,在線上互動(dòng)中獲得樂趣與情感陪伴。在群聊場景,AI 通過角色扮演的方式將自有性格生動(dòng)的表達(dá),AI助手也可以將生硬的官方活動(dòng)信息幽默有趣的傳遞給用戶。
“針對陪伴類聊天應(yīng)用里記憶、人格情緒等技術(shù)難點(diǎn),小紅書采取了基于記憶網(wǎng)絡(luò)、世界體系和驅(qū)動(dòng)飛輪等技術(shù)相結(jié)合的解決方案。通過精細(xì)化記憶建模,對歷史對話進(jìn)行語義分析、重要性判斷、節(jié)點(diǎn)因子建模,從而深入理解用戶行為,構(gòu)建個(gè)性化互動(dòng),實(shí)現(xiàn)越交互越聰明,越聰明越交互的良性循環(huán)?!蓖鯐圆┱f道。
在演講中,王曉博也指出,應(yīng)用場景的落地離不開基礎(chǔ)能力的建設(shè)。
目前,小紅書技術(shù)團(tuán)隊(duì)同時(shí)針對語言模型和多模態(tài)能力進(jìn)行了綜合研發(fā),結(jié)合小紅書自身的業(yè)務(wù)場景和需求,更早做了視覺理解大模型方向的技術(shù)攻關(guān):在多模模型架構(gòu)、多模態(tài)alignment和整個(gè)數(shù)據(jù)體系和視覺感知能力上,都做了一定的探索和優(yōu)化;并基于多種類型的圖文數(shù)據(jù),通過端到端多模態(tài)訓(xùn)練和優(yōu)化,訓(xùn)練了對業(yè)務(wù)場景跟友好的視覺理解大模型,兼顧了圖像分辨率、OCR、長尾語義識別等能力。
目前小紅書在引擎技術(shù)上逐步完備布局,在訓(xùn)練方面對于大模型的工程體系做了完備建設(shè),包括預(yù)訓(xùn)練、SFT、RLHF都做了針對模型和硬件的改造加速,自研了推理框架,對量化壓縮、投機(jī)采樣等技術(shù)都做了進(jìn)一步優(yōu)化。”
其中,比較有亮點(diǎn)的前沿技術(shù),一是在MoE框架下,做了5D并行的高效率訓(xùn)練,同時(shí)自研了RLHF框架,相較于開源框架性能和收斂穩(wěn)定性都有提升。推理上我們做了W4A8模型壓縮,結(jié)合算子優(yōu)化整體性能超過開源框架20%左右?!巴鯐圆┙榻B道。
最后,王曉博表示:“人工智能技術(shù)在多模態(tài)、Agent、算力層都有望持續(xù)進(jìn)步,小紅書也將借助大模型的能力,進(jìn)一步拉近社區(qū)鏈接的距離,更好賦能小紅書之城的用戶們?!?
小紅書于2013年在上海創(chuàng)立,以“Inspire Lives”為使命,形成了內(nèi)容社區(qū)、商業(yè)廣告和電商交易三大業(yè)務(wù)板塊。截至2023年底,小紅書月活用戶數(shù)量超過3億,超50%用戶為95后;同時(shí),小紅書社區(qū)擁有超過1億分享者,他們在小紅書上分享經(jīng)驗(yàn)、記錄生活。自成立以來,小紅書一直以技術(shù)為驅(qū)動(dòng)力,目前持有和申請中的專利、商標(biāo)、版權(quán)超過4000項(xiàng),自研的“珠璣”大模型也已通過算法備案。
標(biāo)簽 小紅書- 責(zé)任編輯: 周毅 
-
多地住建局更名,有何深意?
2024-07-06 21:21 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
不會(huì)再買到爛尾樓了?深圳多家銀行開始執(zhí)行“不封頂不放貸”
2024-07-06 17:43 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
-
科大訊飛董事長:對中美大模型差距不能盲目樂觀
2024-07-05 20:23 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
證監(jiān)會(huì)召開資本市場做好金融“五篇大文章”專題座談會(huì)
2024-07-05 19:34 金融觀察 -
證監(jiān)會(huì):將違規(guī)披露的刑期上限由3年提高至10年
2024-07-05 17:34 金融觀察 -
“全國房價(jià)最貴縣”松綁樓市
2024-07-05 16:17 觀網(wǎng)財(cái)經(jīng)-房產(chǎn) -
總規(guī)模300億元!國有企業(yè)土地資產(chǎn)盤活專項(xiàng)基金成立
2024-07-05 16:05 金融觀察 -
“游戲積累的AI技術(shù)賦能實(shí)體”,網(wǎng)易秀了臺(tái)挖掘機(jī)
2024-07-05 10:13 2024世界人工智能大會(huì) -
螞蟻發(fā)力專業(yè)智能體,井賢棟:未來一定不是只靠一個(gè)大模型
2024-07-05 10:07 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
特斯拉亮相世界人工智能大會(huì),二代人形機(jī)器人迎首秀
2024-07-05 09:57 2024世界人工智能大會(huì) -
T3出行崔大勇:2027年將是自動(dòng)駕駛商業(yè)化運(yùn)營拐點(diǎn)
2024-07-05 09:52 2024世界人工智能大會(huì) -
31省份曬前5個(gè)月財(cái)政收入賬單:粵蘇浙居前三
2024-07-05 07:33 觀網(wǎng)財(cái)經(jīng)-宏觀 -
李彥宏這番話,再度掀起大模型開源閉源之爭?
2024-07-05 07:26 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
阿里王堅(jiān):中國是現(xiàn)階段最不需要擔(dān)心能源的國家
2024-07-04 17:09 2024世界人工智能大會(huì) -
紅豆股份凈利潤倍增背后:“經(jīng)典舒適男裝”是怎樣破圈的?
2024-07-04 11:06 -
特斯拉Model Y進(jìn)入江蘇省政府用車采購目錄
2024-07-04 10:28 -
穩(wěn)坐港股回購?fù)酰◎v訊上半年回購額已超去年全年
2024-07-04 09:56 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng)
相關(guān)推薦 -
“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯” 評論 103最新聞 Hot
-
沖突愈演愈烈,莫迪首發(fā)聲
-
挪威發(fā)布國家安全戰(zhàn)略:美國不可靠,需要跟歐洲抱團(tuán)
-
印度兩座水電站已重新開閘
-
“印巴沖突是敘事之戰(zhàn),中國裝備重要性凸顯”
-
夸大對華關(guān)稅效果,她被打假了
-
突發(fā)!巴稱擊斃約50名印士兵,印稱摧毀巴第二大城市防空系統(tǒng)
-
彈射座椅大廠泄露了印巴空戰(zhàn)戰(zhàn)損“天機(jī)”?
-
巴總理:關(guān)鍵時(shí)刻,感謝“親愛的兄弟”埃爾多安
-
日本地鐵出現(xiàn)隨機(jī)殺人事件,男子揮20厘米菜刀砍傷2人
-
“斯洛伐克幾分鐘前才被通知…現(xiàn)在知道國際政治是啥了吧”
-
“俄羅斯要價(jià)太高,但...”
-
烏克蘭議會(huì)批準(zhǔn)美烏礦產(chǎn)協(xié)議
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責(zé):我們也沒反對阿拉伯海
-
巴外長證實(shí):殲-10擊落印軍“陣風(fēng)”
-
“中國遠(yuǎn)落后于美國的時(shí)代已終結(jié)”
-
“接到指示,美情報(bào)機(jī)構(gòu)加強(qiáng)搜集力度”
-