智東西(公眾號:zhidxcom)
編譯 | 李水青
編輯 | 心緣

GPT-4o新版本降到1塊錢/百萬tokens了,打敗OpenAI的還是OpenAI!

智東西7月19日報道, 7月18日晚間,OpenAI推出最便宜模型GPT-4o mini,我們第一時間將包括OpenAI在內的10家國內外廠商的大模型API最新定價進行了對比,發現這次其他同行壓力不小了。

GPT-4o mini API輸入定價為15美分(約合1.09元人民幣)/百萬tokens,輸出價格為60美分(約合4.36元人民幣)/百萬tokens,相比GPT-3.5 Turbo便宜了超60%;但其能力大幅趕超GPT-3.5 Turbo,在MMLU測試中取得了82%的好成績,并在LMSYS排行榜的聊天偏好方面超越了GPT-4。

此前,許多開發者因大模型價格昂貴,轉向谷歌的Gemini 1.5 Flash、Anthropic的Claude 3 Haiku等小模型?,F在,這些模型都被GPT-4o mini“狙擊”了。

今日,OpenAI殺死ChatGPT-3.5

▲GPT-4o mini性價比遠高于一眾小模型(圖源:Artificial Analysis)

如下表所示,據智東西統計,GPT-4o mini目前定價明顯低于Gemini 1.5 Flash2.5元/百萬tokens的輸入價格、7.6元/百萬tokens的輸出價格,也低于Claude 3 Haiku1.8元/百萬tokens輸入價格、9元/百萬tokens的輸出價格,且性能全方位碾壓它們。

今日,OpenAI殺死ChatGPT-3.5 今日,OpenAI殺死ChatGPT-3.5 今日,OpenAI殺死ChatGPT-3.5

同時,從上表可知,國內廠商如深度求索、智譜AI、字節跳動、阿里云、百度、字節跳動、騰訊云、科大訊飛等在6月陸續將模型大幅降價,但現在價格優勢也被削弱。

比如阿里云Qwen-Turbo輸入價格2元/百萬tokens、輸出價格6元/百萬tokens,百度ERNIE 3.5系列輸入價格12元/百萬tokens、輸出價格12元/百萬tokens,字節Doubao-pro-128k輸入價格5元/百萬tokens、輸出價格9月/百萬tokens……在GPT-4o mini面前,性價比都要打一個大大的問號。

OpenAI CEO Sam Altman稱,GPT-4o mini“走向廉價到無法計量的智能”。

今日,OpenAI殺死ChatGPT-3.5

▲OpenAI CEO Sam Altman在社交平臺X發文

根據OpenAI公告,GPT-4o mini對比2022年功能相對初級的GPT-3的text-davinci-003模型,tokens成本已銳減99%。

目前,GPT-4o mini已免費上線ChatGPT,預計逐步替代GPT-3.5。

一、趕超GPT-3.5 Turbo,問鼎小模型

GPT-4o mini具備低成本和低時延特征,能勝任多種任務,如:鏈接或并行模型調用、處理大量上下文、快速實時文本交互等。

它擁有128k tokens的上下文處理能力,在API中已支持文本和視覺輸入,且支持16k輸出tokens,未來還將擴展到視頻和音頻的輸入/輸出。

在多個全球權威基準測試中,GPT-4o mini成績超越了自家的GPT-3.5 Turbo以及一眾小模型。

今日,OpenAI殺死ChatGPT-3.5

在MMLU文本智能與推理基準測試中,GPT-4o mini以82.0%的得分領先,而Gemini Flash和Claude Haiku分別為77.9%和73.8%。

在MGSM數學推理測試中,GPT-4o mini獲得87.0%的高分,遠超Gemini Flash的75.5%和Claude Haiku的71.7%。

在HumanEval編碼性能測試中,GPT-4o mini也以87.2%的優異成績領先,Gemini Flash和Claude Haiku則分別為71.5%和75.9%。

多模態推理領域,GPT-4o mini在MMMU評估中得分59.4%,同樣領先于Gemini Flash的56.1%和Claude Haiku的50.2%。

在執行任務時,如從收據中提取結構化數據或基于對話歷史生成高質量電子郵件回復等,GPT-4o mini的表現顯著優于GPT-3.5 Turbo。

GPT-4o mini昨夜剛剛發布,AI大牛Andrej Karpathy在社交平臺X上稱:大語言模型的尺寸競爭正在加劇……倒退!我敢打賭,我們會看到非常小的模型,甚至是GPT-2參數級別的模型,已經非常擅長‘思考’”且可靠?!?/span>

今日,OpenAI殺死ChatGPT-3.5

AI大牛Andrej Karpathy在社交平臺X發文

二、API輸入價格低至1元,已免費上線ChatGPT

GPT-4o mini現已正式上線,集成于Assistants API、Chat Completions API及Batch API中,供開發人員使用。

費用方面,GPT-4o mini輸入價格為15美分(約合1.09元人民幣)/百萬tokens,輸出價格為60美分(約合4.36元人民幣)/百萬tokens,這大致相當于處理約2500頁標準書籍內容的成本。

OpenAI計劃在接下來幾天內推出GPT-4o mini的微調功能。

對于ChatGPT用戶,無論是免費版、Plus版還是團隊版,從今天起他們都將能夠體驗到GPT-4o mini,它將逐步替代GPT-3.5。企業用戶也將在下周起接入這一升級。

OpenAI稱,GPT-4o mini繼承了GPT-4o同等嚴格的安全防護機制。其在預訓練階段過濾掉不良信息,進入訓練后采用強化學習與人工反饋(RLHF)等技術,使模型行為更加符合安全策略。

作為首個應用OpenAI指令層次結構方法的模型,GPT-4o mini在API中展現出更強的防御能力,有效抵御越獄攻擊、即時注入及系統即時提取等風險。

OpenAI將持續監控GPT-4o mini的使用情況,一旦發現新風險,立即采取措施提升模型安全性。

OpenAI在公告文末附上了9位團隊負責人的名字,其中Shengjia Zhao、Hongyu Ren、Haitang Hu、Mianna Chen、Kevin Lu五位都是華人面孔,畢業學校涉及到了清華大學、北京大學、同濟大學等國內知名高校。

今日,OpenAI殺死ChatGPT-3.5

結語:模型尺寸競賽逆轉,價格戰加劇

大模型價格戰加劇。OpenAI的GPT-4o mini對比2022年功能相對初級的GPT-3的text-davinci-003模型,tokens成本已銳減99%,這是此前6月份產業價格戰的高潮延續。

OpenAI的每一次發新都把壓力給到同行。而就在同日,英偉達和法國明星AI獨角獸Mistral也聯合發布了名為Mistral NeMo的小杯模型,性能超過Llama 3 8B。更低成本、更高性能的小模型出現,將推動AI無縫融入更多日常場景,也讓產業換一個角度思考AI落地。