-
獨(dú)家對話|戴蘭·帕特爾:誰真正低估了Deepseek?
DeepSeek如何以顛覆性訓(xùn)練策略重構(gòu)大型參數(shù)模型的成本公式?
1月底,美國知名半導(dǎo)體咨詢機(jī)構(gòu)SemiAnalysis發(fā)布的一篇主題圍繞“給Deepseek算經(jīng)濟(jì)賬”的文章,一時間成為全球爆款。近日,心智觀察所就全球LLM模型競爭生態(tài),如何穿透算力軍備競賽的表象,剖析大模型博弈中數(shù)據(jù)、算法、資本的三重角力等問題連線了SemiAnalysis。本次對話由心智觀察所與SemiAnalysis總裁Dylan Patel,資深分析師AJ Kourabi和David Wolfson共同完成。
心智觀察所:SemiAnalysis早在去年五月就發(fā)現(xiàn)了DeepSeek在MoE、RoPE、Attention等領(lǐng)域的創(chuàng)新貢獻(xiàn),你們是如何敏銳地捕捉到DeepSeek為AI模型帶來的突破性?當(dāng)時行業(yè)是否低估了DeepSeek從V2到V3迭代的能力?
SemiAnalysis:我們一直密切關(guān)注AI領(lǐng)域的創(chuàng)新和進(jìn)展,對DeepSeek取得的進(jìn)步印象深刻。絕大多數(shù)領(lǐng)先的AI實(shí)驗(yàn)室并沒有忽視DeepSeek——Anthropic的CEO公開表示,他們從V2甚至更早的時候就開始跟蹤DeepSeek的發(fā)展。我們認(rèn)為,大多數(shù)實(shí)驗(yàn)室都預(yù)計(jì)到了從V2到V3會有這種程度的改進(jìn),除了Meta。
早在2024年5月,SemiAnalysis就發(fā)現(xiàn)了DeepSeek V2相比同行的性價比優(yōu)勢
心智觀察所:TCO模型(總計(jì)算成本)的搭建是一個非常復(fù)雜的項(xiàng)目,涉及服務(wù)器資本支出(CapEx)、員工工資等。SemiAnalysis是否有特定的計(jì)算參數(shù)模型,或者是否收到來自相關(guān)企業(yè)關(guān)于計(jì)算TCO方法的反饋?
SemiAnalysis:我們開發(fā)了自己獨(dú)有的解決方案,并與多家公司合作,提供咨詢服務(wù)以支持他們的集群建設(shè)(注:可參見https://www.semianalysis.com/p/ai-cloud-tco-model)。
心智觀察所:根據(jù)你們的分析,與OpenAI相比,Meta和Google能夠更直接地接觸C端消費(fèi)者。Meta AI是否可能對Google搜索造成不小的沖擊?“中國的Google”——百度搜索,是否也會遇到類似的問題?
SemiAnalysis:Meta擁有直接接觸數(shù)十億日活躍用戶的能力,使他們能夠立即將大量用戶群體調(diào)用于他們引入的任何AI功能。
心智觀察所:未來DeepSeek將會繼續(xù)增強(qiáng)其多模態(tài)能力,你們?nèi)绾卧u估他們與OpenAI(ChatGPT)、Google(Gemini)、Meta(Llama)和Anthropic(Claude)的競爭態(tài)勢?
SemiAnalysis:我們預(yù)計(jì)OpenAI在可預(yù)見的未來,憑借其在人才、基礎(chǔ)設(shè)施和資本方面的卓越資源,將保持對DeepSeek的領(lǐng)先地位。DeepSeek正在利用一種新范式,通過瞄準(zhǔn)低垂果實(shí)實(shí)現(xiàn)快速且成本效益高的進(jìn)展。然而,隨著格局的演變,保持這種勢頭將變得越來越具有挑戰(zhàn)性。同樣,我們也預(yù)計(jì)Google將保持領(lǐng)先地位。
在競爭格局內(nèi)部,Anthropic擁有顯著優(yōu)于DeepSeek的模型,我們預(yù)計(jì)他們將在不久的將來會公開發(fā)布這些模型。另一方面,Meta處于更具挑戰(zhàn)性的位置,因?yàn)樗俏ㄒ灰粋€致力于開源其模型的主要實(shí)驗(yàn)室。據(jù)我們了解,他們正在開發(fā)一個新模型,預(yù)計(jì)其性能將超過DeepSeek,但改進(jìn)的程度是否足以證明推遲發(fā)布是合理的,這一點(diǎn)仍不確定。我們在下面這個鏈接中更詳細(xì)地探討了DeepSeek的進(jìn)展:
https://semianalysis.com/2025/01/31/deepseek-debates/
心智觀察所:DeepSeek的崛起促使行業(yè)重新考慮Scale Law和“算力”的概念。你認(rèn)為這將對英偉達(dá)H200的銷售預(yù)期產(chǎn)生什么影響?
SemiAnalysis:DeepSeek推動了AI擴(kuò)展的創(chuàng)新,證明了戰(zhàn)略性優(yōu)化可以帶來有競爭力的結(jié)果。他們的進(jìn)展增加了對AI基礎(chǔ)設(shè)施和計(jì)算資源的需求,同時加劇了頂級實(shí)驗(yàn)室之間的競爭,進(jìn)一步加速了該領(lǐng)域的進(jìn)展。
心智觀察所:推理成本的下降是AI進(jìn)步的一個標(biāo)志。從訓(xùn)練到推理,總體而言,像GPT、Gemini和Claude這樣的產(chǎn)品如何應(yīng)對持續(xù)降低推理成本的挑戰(zhàn),以及他們?nèi)绾握{(diào)整其API定價策略?“杰文斯悖論”是否被過度炒作?
SemiAnalysis:許多頂級AI實(shí)驗(yàn)室正在積極開發(fā)針對降低成本的創(chuàng)新,這些AI實(shí)驗(yàn)室往往從這些創(chuàng)新中受益最多。當(dāng)競爭對手提供更低的價格時,供應(yīng)商不得不通過調(diào)整定價來應(yīng)對。通常,API定價策略會根據(jù)市場壓力和推動成本下降的內(nèi)部進(jìn)展進(jìn)行調(diào)整。然而,在某些情況下,供應(yīng)商并沒有降低價格,而是擴(kuò)大了對替代性模型的訪問——例如OpenAI在DeepSeek取得突破后不久發(fā)布了o3-mini。我們認(rèn)為“杰文斯悖論”并沒有被低估,并且我們之前的研究已經(jīng)廣泛覆蓋了這個話題。
心智觀察所:你如何評估由OpenAI領(lǐng)導(dǎo)的“Stargate”計(jì)劃?該計(jì)劃需要動員大量人力和物力資源。這個計(jì)劃能否與“芯片法案”這樣的計(jì)劃形成聯(lián)動?
SemiAnalysis:OpenAI的“Stargate”計(jì)劃與芯片法案完全獨(dú)立,因?yàn)樗鼘W⒂跀U(kuò)展AI基礎(chǔ)設(shè)施,而不是對半導(dǎo)體制造端的激勵。雖然兩者都涉及大量資源動員,但Stargate是一項(xiàng)私有部門的努力,旨在構(gòu)建先進(jìn)的AI系統(tǒng),而芯片法案是一項(xiàng)政府計(jì)劃,旨在提升國內(nèi)芯片產(chǎn)量。兩者之間沒有直接聯(lián)系。
DeepSeek-V3競爭性分析
心智觀察所:SemiAnalysis正在吸引越來越多來自中國產(chǎn)業(yè)部門的關(guān)注,近來幾乎每篇文章都會引發(fā)廣泛討論。能否談?wù)凷emiAnalysis在市場研究和行業(yè)觀察方面是否有一套獨(dú)特的方法論?能否介紹一下你們團(tuán)隊(duì)的規(guī)模和盈利模式?
SemiAnalysis:我們的方法并不是什么“秘密配方”——而是對制造業(yè)、供應(yīng)鏈、技術(shù)部署以及AI基礎(chǔ)設(shè)施戰(zhàn)略進(jìn)行嚴(yán)格研究的結(jié)果。這項(xiàng)工作需要一個高度敬業(yè)的團(tuán)隊(duì),他們對技術(shù)和分析充滿熱情。隨著我們服務(wù)的擴(kuò)展,我們的團(tuán)隊(duì)也在不斷壯大,從最初的幾個人發(fā)展到全球約25名分析師,目前分布于北美、歐洲和亞洲等區(qū)域。
SemiAnalysis沒有“中央辦公室”,我們的盈利模式基于銷售行業(yè)和金融研究。我們的客戶范圍覆蓋從初創(chuàng)公司到全球財(cái)富100強(qiáng)公司,技術(shù)公司和投資公司各占一半。我們的業(yè)務(wù)范圍包括從簡單的新聞通訊訂閱到與專門分析師進(jìn)行為期數(shù)月的咨詢服務(wù)等。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個人觀點(diǎn),不代表平臺觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 心智觀察所-
本文僅代表作者個人觀點(diǎn)。
- 責(zé)任編輯: 李昊 
-
韓國報(bào)告:韓半導(dǎo)體關(guān)鍵技術(shù)兩年內(nèi)全面落后中國
2025-02-23 21:49 三八線之南 -
我國最新成果!量子直接通信有望進(jìn)入實(shí)際應(yīng)用
2025-02-22 22:04 科技前沿 -
我國成功發(fā)射中星10R衛(wèi)星
2025-02-22 21:19 航空航天 -
“中美同日宣布新突破,高下立判”
2025-02-21 22:45 觀察者頭條 -
日本喊疼:很難遵守中方出口管制,這不止針對美國啊…
2025-02-21 17:37 日本 -
我國自主研制AS700D載人飛艇完成首次科研試飛
2025-02-21 13:21 科技前沿 -
填補(bǔ)關(guān)鍵技術(shù)空白!我國量子科技研究迎突破性進(jìn)展
2025-02-20 13:30 科技前沿 -
多地政務(wù)服務(wù)系統(tǒng)接入DeepSeek大模型
2025-02-20 06:46 -
虞仁榮的亮相,窺見中國經(jīng)濟(jì)更深處的變革
2025-02-19 17:37 心智觀察所 -
“搞一堆新名詞,十有八九是騙子”,項(xiàng)目能不能落地,問三個問題
2025-02-18 22:42 -
國際首個!我國腦機(jī)接口取得新突破
2025-02-18 10:03 科技前沿 -
事關(guān)高溫超導(dǎo),中國科學(xué)家有突破性發(fā)現(xiàn)!
2025-02-18 09:46 科技前沿 -
百度搜索:將全面接入DeepSeek及文心大模型深度搜索功能
2025-02-16 21:42 大公司 -
馬斯克宣布:即將發(fā)布新AI模型,地球上最聰明
2025-02-16 19:55 -
“中國科技飛躍,未來已來!”
2025-02-14 23:04 觀察者頭條 -
OpenAI奧特曼:GPT-5標(biāo)準(zhǔn)版將免費(fèi)無限使用
2025-02-13 10:48 人工智能 -
首爾大學(xué)屏蔽DeepSeek,稱有“安全隱患”
2025-02-13 09:20 三八線之南 -
看了這個游戲中的古建筑設(shè)定,想到林徽因說的“乾隆taste”
2025-02-13 09:08 心智觀察所 -
鋰電池“打一針”就能“重生”!《自然》刊登我國科研團(tuán)隊(duì)新發(fā)現(xiàn)
2025-02-13 06:42 -
從四個角度全面駁斥美方對DeepSeek的質(zhì)疑和污蔑
2025-02-12 07:34 心智觀察所
相關(guān)推薦 -
最新聞 Hot
-
“很明顯,幾乎所有美國出口都受到了打擊”
-
“指揮混亂!他突然擅自下令,特朗普都被蒙在鼓里”
-
“我們國家正處于脆弱時刻,美國卻在丑陋地炫耀權(quán)力”
-
涉1000億歐元美國商品,歐盟考慮:談不成就動手
-
后院起火?加拿大“最保守省”醞釀“獨(dú)立公投”
-
日本先談判先遇挫,特朗普政府又臭又硬、寸步不讓
-
美財(cái)長賣力為關(guān)稅洗地,臺下高管們只關(guān)注中國
-
特朗普又開新戰(zhàn)線,“只會鼓勵各國像中國一樣反制”
-
印外長懟歐盟:這么依賴中美俄,還想戰(zhàn)略自主…
-
“美國買家缺席,結(jié)果很意外!”
-
日本想“跪”,被警告:政府將垮臺
-
特朗普:最初是我“炸”了它
-
“關(guān)稅將抹掉15億美元利潤”,福特撤回了一個預(yù)期
-
縣長張漢坤官宣被查,公安局長落馬后“消失”4個月
-
今年第三次議息,美聯(lián)儲“將無視特朗普,維持不變”
-
在他嘴里,加拿大都成了“靠美國養(yǎng)活的社會主義政權(quán)”
-