OpenAI連甩5款新模型!價格暴降,功力大漲,還修復了GPT-4變懶問題

智東西(公眾號:zhidxcom)
編譯 | 云鵬
編輯 | 心緣

智東西1月26日報道,昨夜,OpenAI發布了一系列重磅大模型更新,連發了五個新模型以及新的API使用管理工具,總體來說可以說是“加量不加價”,OpenAI的友商們一覺醒來壓力著實又大了不少。

首先,來看看新品和新特性:

1、新的GPT-3.5 Turbo模型,輸入價格暴降50%,輸出價格降低25%,同時修復各種BUG,回應準確性更高,老用戶兩周后還可自動升級!

2、新的GPT-4 Turbo預覽模型,生成代碼能力更強,模型“變懶”情況減少,修復各種BUG,帶有視覺功能的GPT-4 Turbo也會在未來幾個月內推出!

3、新的小型文本嵌入模型text-embedding-3-small,性能小幅提升,價格直接“打骨折”,暴降至上代的五分之一。

4、新的大型文本嵌入模型text-embedding-3-large,核心就是性能強,可創建多達3072維的嵌入,部分測試性能提升70%以上,價格略貴一點點。同時,OpenAI還搞了個新技術,直接讓開發者在略微損失精度的情況下縮短嵌入,實現性能和成本的平衡,靈活性極大提升。

5、新的審查模型text-moderation-007,OpenAI將其稱之為“迄今為止最強大的審查模型”。

新的API使用管理工具我們不在此贅述。

哦對了,最后OpenAI還很貼心地提示說,默認情況下,發送到OpenAI API的數據將不會被用于訓練或改進OpenAI模型。話不多說,我們具體來看看今天各個重磅新品的升級細節。

一、五分之一的價格,更強的性能,模型使用靈活性顯著提升

首先來看看OpenAI此次新推出的兩個嵌入模型,更小且高效的text-embedding-3-small模型,以及更大且更強的text-embedding-3-large模型。

在看模型之前,首先要理解下什么是“嵌入(embedding)”,簡單來說,嵌入是一系列數字,而這些數字代表了自然語言或代碼等內容中的概念。

OpenAI連甩5款新模型!價格暴降,功力大漲,還修復了GPT-4變懶問題

▲嵌入(embedding)示意圖

嵌入讓機器學習模型和其他算法能夠理解內容之間的關系,并執行如聚類或檢索等任務,為ChatGPT和Assistants API中的知識檢索,以及許多檢索增強生成(RAG)開發者工具提供了支持。

新的小型文本嵌入模型text-embedding-3-small相比于2022年12月發布的前代模型text-embedding-ada-002主要有兩方面升級:更強的性能、更低的價格。

性能方面,在一個常用的多語言檢索基準(MIRACL)測試中,text-embedding-3-small平均分數從31.4%增加到了44.0%,在一個常用的英語任務基準(MTEB)測試中,其平均分數從61.0%增加到62.3%。

OpenAI連甩5款新模型!價格暴降,功力大漲,還修復了GPT-4變懶問題

▲text-embedding-3-small測試成績

價格方面,text-embedding-3-small的價格僅為上代的五分之一,每1000個tokens的價格從0.0001美元降低到0.00002美元。

另外一個新的大型文本嵌入模型text-embedding-3-large,據稱可以創建多達3072維(dimensions)的嵌入,其主要提升在于性能。

性能方面,text-embedding-3-large在MIRACL測試中的平均分數從31.4%增加到54.9%,而在MTEB測試中,其平均分數從61.0%增加到64.6%。價格為0.00013美元/1000 tokens。

眾所周知,用更大的嵌入,會消耗更多的計算、內存和存儲資源,比使用更小的嵌入成本更高。

為此OpenAI推出了一種新的技術,讓開發者可以在使用嵌入的性能和成本之間進行權衡。具體來說,開發者可以通過調整維度API參數(dimensions API parameter)來縮短嵌入,同時保證嵌入不會失去其表示概念的屬性。

比如,在MTEB基準測試中,一個text-embedding-3-large嵌入可以被縮短到256的大小,但其測試成績仍然優于一個未縮短的、大小為1536的text-embedding-ada-002嵌入。

OpenAI連甩5款新模型!價格暴降,功力大漲,還修復了GPT-4變懶問題

▲縮短到256大小的text-embedding-3-large與未縮短的、大小為1536的text-embedding-ada-002測試成績對比

這樣的特性可以讓使用變得非常靈活。比如當開發者使用一個最多只支持1024維嵌入的向量數據存儲時,他仍然可以使用性能最強的text-embedding-3-large模型,他只需要為維度API參數指定一個1024的值,將嵌入從3072維縮短,當然精度會略有損失。

二、兩大經典產品重磅升級,模型更勤快,代碼能力增強,后續還會支持視覺功能

1、新的GPT-3.5 Turbo模型——輸入輸出價格大幅下降,老用戶升級方便

除了兩個嵌入模型,這次OpenAI還宣布將在下周推出一個新的GPT-3.5 Turbo模型——gpt-3.5-turbo-0125,并且進一步降低其使用價格,這已經是過去一年時間里OpenAI對其進行的第三次降價了。

到底有多便宜呢?gpt-3.5-turbo-0125輸入的價格降低了50%,為0.0005美元/1000 tokens,輸出價格也降低了25%,為0.0015美元/1000 tokens。

當然,gpt-3.5-turbo-0125還會有各種升級,比如在以請求的格式回應時,會有更高準確性,同時OpenAI還修復了一些BUG。

另一個好消息是,使用pinned gpt-3.5-turbo模型alias的老客戶將在新模型發布后的兩周內自動升級。

2、新的GPT-4 Turbo預覽模型——代碼更強,減少“變懶”

除了GPT-3.5 Turbo,OpenAI這次還發布了新的GPT-4 Turbo預覽模型——gpt-4-0125-preview。

這個模型可以比之前的預覽模型更完整地完成像代碼生成這樣的任務,并且可以減少模型“變懶(laziness)”不完成任務的情況。去年年底,GPT-4被發現“變懶”問題愈發嚴重,出現回應速度慢、回答敷衍、不聽指令、寫代碼愛省略甚至拒絕回答、中斷會話等情況。?當然,新模型也修復了一些BUG。

對于新的GPT-4 Turbo預覽模型,OpenAI也引入了相關自動升級機制,如果用戶訂購了相關服務,他就會一直能夠使用最新版的GPT-4 Turbo預覽模型。

值得一提的是,OpenAI還提到他們計劃在未來幾個月內推出帶有視覺功能的GPT-4 Turbo。

3、“迄今為止最強大的審查模型”

最后一個新產品是一個新的審查模型——text-moderation-007,OpenAI稱之為“迄今為止最強大的審查模型”,免費的審查API可以允許開發者識別可能有害的文本。

4、兩項平臺改進,提升開發者API使用管理體驗

此外,OpenAI正在推出兩項平臺改進,讓API密鑰的使用有更好的透明度,同時讓開發者對API密鑰有更多的控制權。

第一項改進是,開發者可以從API密鑰頁面為API密鑰分配權限。第二項改進是,使用儀表板和使用導出功能在打開跟蹤后可以顯示API密鑰級別的度量。

OpenAI連甩5款新模型!價格暴降,功力大漲,還修復了GPT-4變懶問題

▲儀表盤可以顯示API密鑰級別的度量

這樣一來,只需要為每個功能、團隊、產品或項目分配單獨的API密鑰,就可以簡單地查看每個級別的使用情況。

結語:性能更強價格更低,OpenAI大模型繼續鞏固優勢

此次OpenAI發布的多款大模型新品,都在上代產品基礎上實現了一定的性能提升,在開發者使用的便捷程度、靈活程度上有一定改進,同時在價格方面給予了不小的優惠。

對于OpenAI來說,大模型生態的完善離不開開發者,今天的一系列“加量不加價”的操作也勢必會增加OpenAI產品的競爭力。OpenAI的對手們將會做和應對、未來視覺大模型的出現又會給產業帶來哪些新變量,我們拭目以待。

來源:OpenAI