智東西(公眾號:zhidxcom)
編譯 | 羅添瑾
編輯 | 云鵬

智東西7月17日消息,昨日據VentureBeat報道,法國AI創企Mistral AI近日推出了兩款新AI模型,一個是面向程序員和開發人員的代碼生成模型Codestral Mamba?7B,另一個是專為數學相關推理和科學發現而設計的AI模型Mathstral?7B。

Codestral Mamba?7B具有更快的推理速度和更長的上下文,即使在輸入文本較長的情況下也能提供快速響應時間。同時,該模型可處理多達256000個token的輸入,是GPT-4o的兩倍。

Mathstral?7B有一個32K上下文窗口,并將使用Apache 2.0開源許可證,它可以在具有更多推理時間計算的基準上獲得優于其他數學推理模型的效果,該模型還具備微調功能。

一、代碼生成模型能夠處理更長的上下文

資金雄厚的法國AI初創公司Mistral AI以其強大的開源AI模型而聞名,如今在其不斷增長的大型語言模型(LLM)系列中推出了兩個新條目:一個基于數學的模型和一個面向程序員和開發人員的代碼生成模型,該模型基于其他研究人員去年年底開發的新架構Mamba。

Mamba試圖通過簡化其注意力機制來提高大多數領先的LLM使用的transformer架構的效率?;贛amba的模型與更常見的基于Transformer的模型不同,它可能具有更快的推理速度和更大的上下文窗口。包括AI21在內的其他公司和開發人員已經發布了基于它的新AI模型。

現在,使用這種新架構,Mistral AI恰如其分地將其命名為Codestral Mamba?7B,即使在輸入文本較長的情況下也能提供快速響應時間。Codestral Mamba適用于代碼生產力用例,尤其是對于更本地的編碼項目。

Mistral AI測試了該模型,該模型將在Mistral AI的la Plateforme?API上免費使用,處理多達256000個token的輸入,是OpenAI的GPT-4o的兩倍。

Mistral AI表明,在HumanEval等基準測試中,Codestral Mamba比競爭對手的開源模型CodeLlama 7B、CodeGemma-1.17B和DeepSeek 表現得更好。

明星AI獨角獸Mistral AI亮出大模型新王炸,代碼和數學能力超群▲(圖源:Mistral AI)

開發人員可以從其GitHub存儲庫和HuggingFace修改和部署Codestral Mamba。它將通過開源Apache 2.0許可證提供。

Mistral AI聲稱早期版本的Codestral優于CodeLlama 70B和DeepSeek Coder 33B等其他代碼生成器。

代碼生成和編碼助手已成為AI模型廣泛使用的應用程序,由OpenAI提供支持的GitHub的Copilot、亞馬遜的CodeWhisperer和Codenium等平臺越來越受歡迎。

二、數學推理模型能力超群,還具備微調功能

Mistral AI推出的第二個模型是Mathstral?7B,這是一個專為數學相關推理和科學發現而設計的AI模型。Mistral AI通過Project Numina開發了 Mathstral。

Mathstral有一個32K上下文窗口,并將使用Apache 2.0開源許可證。Mistral AI稱,該模型的表現優于所有為數學推理設計的模型。它可以在具有更多推理時間計算的基準上獲得“明顯更好的結果”。用戶可以按原樣使用它或微調模型。

Mistral AI在一篇博客文章中說:“Mathstral是另一個例子,展示了在為特定目的構建模型時實現出色的性能——這是我們在la Plateforme中積極推廣的開發理念,特別是其新的微調功能?!?/p>

明星AI獨角獸Mistral AI亮出大模型新王炸,代碼和數學能力超群▲(圖源:Mistral AI)

Mathstral可以通過Mistral AI的la Plataforme和HuggingFace訪問。

Mistral AI傾向于在開源系統上提供其模型,該公司一直在與OpenAI和Anthropic等其他AI開發人員競爭。

該公司最近在B輪融資中籌集了6.4億美元,估值接近60億美元。該公司還獲得了微軟和IBM等科技巨頭的投資。

結語:大模型性能之戰卷出新高度

從產業角度來看,Mistral AI的新模型突顯了AI工具向專業化發展的趨勢,通過提供如Mistral 7B和Codestral Mamba?7B這樣的強大且可訪問的模型,Mistral AI正在成為AI領域的重要參與者,促進創新和實用應用的發展。

這些模型還強調了開源AI的重要性,鼓勵技術社區內的合作與更高的透明度。通過向更廣泛的受眾提供強大的AI工具,進一步推進AI大模型領域的迅速迭代于發展。

來源:VentureBeat