-
OpenAI推出GPT-4o mini,號稱“最具成本效益的小模型”
最后更新: 2024-07-19 11:44:46美東時間7月18日,OpenAI推出GPT-4o mini,并聲稱這是“最具成本效益的小型模型”。GPT-4o mini預計將通過讓智能變得更加實惠,顯著擴大使用AI構建的應用程序范圍。
據(jù)OpenAI發(fā)布的消息,GPT-4o mini在MMLU(大規(guī)模多任務語言理解,衡量模型廣泛的世界知識和解決問題的能力)上的得分為82%,比另外兩款低成本競品更高——Google的Gemini Flash得分為77.9%,Anthropic的Claude Haiku得分為73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面優(yōu)于GPT-4.
GPT-4o mini已經(jīng)在幾個關鍵基準上進行了評估,涉及文本和視覺的推理任務、數(shù)學推理和編碼任務、多模態(tài)推理,結果均優(yōu)于其他小型模型。
各種評估基準下的模型評估分數(shù)OpenAI官方網(wǎng)站
GPT-4o mini還在API中支持文本和視覺功能,未來還將支持文本、圖像、視頻和音頻的輸入和輸出,并且擁有截至2023年10月的知識。得益于與GPT-4o共享的改進的tokenizer(編譯器),GPT-4o mini處理非英語文本方面也更具成本效益。
GPT-4o mini成本更低、延遲更低,能夠完成更多的任務,例如調(diào)用多個API(應用程序編程接口)、傳遞和記錄大量完整的代碼庫或?qū)υ捰涗?、更快速、實時地與使用者聊天等。
作為模型開發(fā)過程的一部分,OpenAI 已經(jīng)與一些值得信賴的合作伙伴合作,以更好地了解GPT-4o mini的使用場景和局限性。目前已與Ramp和超人等公司進行了合作,反饋發(fā)現(xiàn)在執(zhí)行從收據(jù)文件中提取結構化數(shù)據(jù)或在提供線程歷史記錄時生成高質(zhì)量電子郵件響應等任務時,GPT-4o mini的表現(xiàn)明顯優(yōu)于GPT-3.5 Turbo。
考慮到價格因素,輕量化且廉價的“小而精”AI模型可能更受企業(yè)歡迎,小模型的相關開發(fā)競爭激烈。談及為何沒有更早地推出“小而精”的模型時,OpenAI的API產(chǎn)品負責人Olivier Godement說,“我們的使命是使用最前沿技術,構建最強大、最有用的應用程序,我們當然希望繼續(xù)做前沿模型,推動技術進步……但我們也希望擁有最好的小模型,我認為它會非常受歡迎?!?
OpenAI稱,開發(fā)過程中的每一步都考慮了安全性。開發(fā)時會過濾掉仇恨言論、色情信息、個人隱私信息等不宜模型學習和輸出的內(nèi)容,并采用自動和人工(超過70位來自社會心理學和錯誤信息等領域的外部專家)對模型進行了評估,以識別潛在風險。GPT-4o mini是第一個應用指令層次結構的模型,有助于提高模型抵抗越獄、即時注入和系統(tǒng)即時提取的能力,這使得模型的響應更加可靠,并有助于使其在大規(guī)模應用中更安全地使用。
自2022年推出功能較弱的模型text-davinci-003以來,GPT-4o mini的每token成本已下降99%。GPT-4o mini定價比之前的Frontier型號便宜一個數(shù)量級,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免費版、Plus版和團隊版用戶已經(jīng)能夠使用GPT-4o mini替代GPT-3.5,企業(yè)用戶也將從下周開始使用。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
- 責任編輯: 李亞麗 
-
被歐盟法院裁定為“守門人”,字節(jié)跳動:失望
2024-07-18 17:54 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
去年虧損近40億元,東風汽車集團仍難回歸A股
2024-07-18 17:22 觀出行 產(chǎn)業(yè)新聞 -
開售3個月,華為Pura70官宣降價
2024-07-18 13:32 觀網(wǎng)財經(jīng)-科創(chuàng) -
20多座高鐵站“閑置”,還有救嗎?
2024-07-18 13:28 高鐵世紀 -
“實現(xiàn)中國式現(xiàn)代化,需要三大區(qū)域共挑大梁”
2024-07-18 11:36 中國經(jīng)濟 -
陳文玲:開放就是最大的改革
2024-07-18 10:33 2024中國經(jīng)濟季度觀察 -
陳文玲:這是中國在大國競爭博弈中的底氣
2024-07-18 10:33 2024中國經(jīng)濟季度觀察 -
香港消委會就農(nóng)夫山泉事件致歉
2024-07-18 09:22 觀網(wǎng)財經(jīng)-消費 -
飲用水跌回“1元時代”
2024-07-18 07:34 觀網(wǎng)財經(jīng)-消費 -
31省份上半年人均可支配收入:10省份超兩萬元
2024-07-17 20:20 觀網(wǎng)財經(jīng)-宏觀 -
管濤:人民幣國際化加速的原因是……?
2024-07-17 18:14 中國經(jīng)濟 -
普華永道將裁掉一半在中國的金融審計員工?回應稱,調(diào)整是艱難的決定
2024-07-17 17:29 金融觀察 -
中國大陸發(fā)力成熟芯片,連續(xù)占據(jù)光刻機巨頭半數(shù)營收
2024-07-17 15:41 觀網(wǎng)財經(jīng)-科創(chuàng) -
中國經(jīng)濟發(fā)展有獨門法寶
2024-07-17 15:34 2024中國經(jīng)濟季度觀察 -
楊建文:產(chǎn)業(yè)層面要能夠推出“新新三樣”
2024-07-17 15:22 2024中國經(jīng)濟季度觀察 -
財政部擬再發(fā)總額550億元超長期特別國債
2024-07-17 15:20 金融觀察 -
“如果讓購房者感受到,之后再也沒有這么低的按揭利率…”
2024-07-17 13:50 觀網(wǎng)財經(jīng)-房產(chǎn) -
連平:房地產(chǎn)企穩(wěn)將是重要的積極信號
2024-07-17 13:40 2024中國經(jīng)濟季度觀察 -
特朗普稱臺灣應交“保護費”,臺積電應聲大跌超2%
2024-07-17 11:47 特朗普 -
一夜之間,黃金價格再創(chuàng)新高!有人一次下單近20萬元金條
2024-07-17 09:57 黃金游戲
相關推薦 -
特朗普故弄玄虛稱“和某大國達成協(xié)議”,就這? 評論 109巴外長證實:殲-10擊落印軍“陣風” 評論 676美財長:這些嬰童用品從中國進口,考慮降稅 評論 155“荒謬言論”,默茨:我會跟特朗普談談 評論 60中方同意接觸,美媒緊盯:事關重大、令人鼓舞 評論 110最新聞 Hot
-
“特朗普稱要把這改叫阿拉伯灣”,伊朗譴責:我們也沒反對阿拉伯海
-
巴外長證實:殲-10擊落印軍“陣風”
-
“中國遠落后于美國的時代已終結”
-
“接到指示,美情報機構加強搜集力度”
-
“雙方出動125架戰(zhàn)機,交火距離一度超過160公里”
-
門票價格從10元上漲到85元?西安碑林博物館回應
-
美財長:這些嬰童用品從中國進口,考慮降稅
-
烏克蘭央行行長:考慮放棄美元
-
美聯(lián)儲:就是不降息
-
法方證實:至少一架陣風戰(zhàn)斗機被擊落
-
特朗普:愿意出面
-
“敵人哀嚎,印軍引以為傲5架戰(zhàn)機,化為灰燼”
-
“軟實力”概念提出者約瑟夫·奈去世,享年88歲
-
戴維·珀杜宣誓就任美國駐華大使,特朗普出席就職典禮
-
教皇選舉首輪投票結果出爐:是黑煙
-
“荒謬言論”,默茨:我會跟特朗普談談
-