華為哈勃領投,清華系大模型創企完成數億元融資

智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西4月11日報道,今日,面壁智能宣布完成新一輪數億元融資,由春華創投、華為哈勃領投,北京市人工智能產業投資基金等跟投,知乎作為戰略股東持續跟投支持。本輪由光源資本擔任獨家財務顧問。

這是華為哈勃又一次出手投資大模型企業。此前它在去年8月參與了AI4Science獨角獸企業深勢科技超7億元的股權融資。深勢科技曾推出分子大模型Uni-Mol、科學文獻多模態大模型Uni-SMART等。

華為哈勃最新投資的面壁智能,成立于2022年8月,總部在北京,是國內最早開始探索大模型和AGI的團隊之一。去年4月,面壁智能完成數千萬元天使輪融資,知乎領投,智譜AI跟投。

面壁智能的核心研發團隊脫胎于清華NLP實驗室,團隊還有來自阿里、字節、百度等國內外知名公司的人才。在創立初始階段,面壁即開始Agent研究探索,2023年發布了大模型驅動下的Al Agent “三駕馬車”,全面覆蓋單體智能、群體智能和智能體應用框架領域。

在高效推理方面,面壁率先以“銜尾蛇投機采樣”為代表的協同推理技術,在云側建立起大小模型之間的協同,極大提升云側大模型的服務速度。與面壁端側模型相結合,有望通過端云協同推理來進一步降低大模型使用成本。

目前面壁智能已完成了貫徹高效訓練、高效落地與高效推理的大模型全棧技術生產線布局,與招商銀行、數科網維、知乎等合作伙伴一同將大模型與Agent技術部署落地于金融、教育、政務、智能終端等應用場景。

繼今年2月開源發布端側模型面壁MiniCPM后,面壁智能今日推出了新一代MiniCPM 2系列模型,包括4款模型:

華為哈勃領投,清華系大模型創企完成數億元融資▲面壁智能聯合創始人、CEO李大海發布MiniCPM 2系列模型

1、MiniCPM-V2.0多模態模型參數規模僅2.8B,小到可以部署在手機上,顯著增強了OCR(光學字符識別)能力,刷新OCR綜合性榜單開源模型表現,通用場景文字理解能力比肩Gemini Pro,超過Owen-VL-Chat-10B、CogVLM-Chat-17B等百億級參數量的模型,中文OCR識別能力顯著超過GPT-4V,幻覺水平與GPT-4V持平。

華為哈勃領投,清華系大模型創企完成數億元融資

華為哈勃領投,清華系大模型創企完成數億元融資

華為哈勃領投,清華系大模型創企完成數億元融資

2、MiniCPM-2B-128k長文本模型最小的128K長文本,將原有的4K上下文窗口擴展到了128K,在InfiniteBench榜單上的平均成績超過了Yarn-Mistral-7B-128K、Yi-6B-200K、ChatGLM3-6B-128K、LWM-Text-128K等6B、7B量級模型。

華為哈勃領投,清華系大模型創企完成數億元融資

3、MiniCPM-MoE-8x2B MoE模型引入MoE架構,性能增強,超過Llama 2-34B及全系7B量級模型,推理成本僅為Gemma-7B的69.7%。

華為哈勃領投,清華系大模型創企完成數億元融資

4、MiniCPM-1.2B模型參數減少一半,仍保持上一代2.4B模型87%的綜合性能,比上一代推理速度提高38%。在多個公開權威測試榜單上,取得了綜合性能超過Qwen-1.8B、Llama 2-7B甚至超過Llama 2-13B的成績。在iOS上,MiniCPM-2.4B的量化模型是2.10G,而MiniCPM-1.2B只有1.01G,占用內存減少51.9%,估算成本下降60%。

華為哈勃領投,清華系大模型創企完成數億元融資

上述模型中,新一代MiniCPM-V 2.0多模態大模型的通用能力大大增強, 結合古文字語料,嘗試破解古籍中的謎團,對清華大學收藏的一批戰國竹簡——清華簡進行了字跡識別,相比同類中文標桿多模態大模型,表現更優異。

華為哈勃領投,清華系大模型創企完成數億元融資

傳統方法通常只能處理448×448像素的小圖,難以讀取被壓縮到模糊的文字信息。而有著復雜畫面及文字細節的街景長圖,通常得是高清大圖,才能將這些細節充分呈現。

華為哈勃領投,清華系大模型創企完成數億元融資

MiniCPM-V 2.0基于在高清圖高效編碼方面的技術,可以處理高至180萬像素(1344×1344)的高清大圖,而且可以是這一像素內任意寬高比的圖像,并能支持448×4032這種1:9的極端寬高比無損編碼。它也能快速識別長圖文字,捕捉重點信息。

華為哈勃領投,清華系大模型創企完成數億元融資

其高清圖高效編碼背后的獨家技術是LLaVA-UHD。

華為哈勃領投,清華系大模型創企完成數億元融資

基于跨語言多模態泛化技術,新一代MiniCPM-V 2.0可以快速識別全英文菜譜,這樣一來,出國但外語不好的人就能用手機輕松點菜。

華為哈勃領投,清華系大模型創企完成數億元融資

該技術的研究論文發表于ICLR 2024,旨在解決中文領域缺乏高質量、大規模多模態數據的挑戰,基于基座模型中英雙語能力,僅通過英文通用域圖文對數據進行預訓練,實現多模態基礎能力從英文到中文的跨語言泛化。