1、蘋果多模態大模型研究進展公布

2、蘋果收購加拿大AI創企

3、Anthropic正吸引金融、醫療領域企業

4、甲骨文云應用套件增加新生成式AI功能

5、騰訊清華港科大聯合推出圖生視頻模型

6、小米14 Ultra上線相冊AIGC編輯

7、華為發布政務、城市大模型首批應用場景

8、華為系大模型創企獲千萬級天使輪融資

9、AI驅動美圖2023年凈利潤大漲233.2%

10、生數科技多模態大模型通過國家備案

11、海信發布自研星海大模型

12、杭州發布首個成果轉化領域大模型

13、漢王科技天地大模型通過國家備案

14、首個區域實時文生圖架構發布

15、3D視覺語言動作生成世界模型發布

16、預計今年中國AI訓推一體機市場空間168億元

17、歐盟調查大型科技公司對生成式AI的使用

18、OpenAI模型驅動人形機器人自主對話

19、OpenAI官宣新的國際新聞機構合作伙伴

20、Sora將于年內推出 擬增加語音功能

21、阿爾特曼稱被起訴后與馬斯克互發短信

22、微軟Copilot安全版4月1日全球發布

23、微軟Copilot Pro介紹中出現GPT-5

24、谷歌發布通用游戲AI智能體

25、谷歌發布讓人物照片說話的方法VLOGGER

26、百度推出首個消費者組織數字人

27、阿里巴巴全球數學競賽首次向AI開放

28、零一萬物API上線 支持輸入30萬漢字

29、智譜AI獲北京市AI產業投資基金參投融資

30、王小川稱百川不走Sora路徑

31、曠視透露“大模型+機器人”計劃

32、傳拼多多不做大模型布局

33、網絡芯片創企篆芯獲2億元融資

34、英偉達將推出生成式AI專業認證

35、傳軟銀考慮投資法國創企Mistral AI

36、Claude 3 Haiku正式上線

37、歐盟議會批準全球首個AI法案

38、創企Cerebras發布最快AI芯片WSE-3

39、AI創企Kolena推出大模型測試驗證平臺

40、AI基礎設施平臺Together AI晉升獨角獸

1、蘋果多模態大模型研究進展公布

今天,根據預印本平臺arXiv,蘋果研究人員公布了最新多模態大模型研究成果MM1,這一系列模型參數最高為30B。得益于大規模的預訓練,MM1具有增強的上下文學習和多圖像推理等能力,可以實現少量的思維鏈提示。

論文地址:https://arxiv.org/pdf/2403.09611.pdf

2、蘋果收購加拿大AI創企

據彭博社報道,蘋果今年早些時候已收購加拿大AI創企DarwinAI,并將這家創企的數十名員工納入了其AI部門中。DarwinAI的主要業務包括為制造商制造可以進行視覺檢查的AI系統,以及“使神經網絡模型更小、更快”。

3、Anthropic正吸引金融、醫療領域企業

今天,大模型創企Anthropic聯合創始人Daniela Amodei在接受彭博社采訪時提到,歸功于其新發布的大模型Claude 3系列,Anthropic正在吸引金融服務和醫療保健領域的企業。

4、甲骨文云應用套件增加新生成式AI功能

昨天,甲骨文宣布將在甲骨文融合云應用套件中推出新的生成式AI功能,包括嵌入財務、供應鏈、人力資源、銷售、營銷和服務等現有業務工作流程中的新功能,以及Oracle Guided Journeys的可擴展性框架的支持。

5、騰訊清華港科大聯合推出圖生視頻模型

3月13日,騰訊、清華大學、香港科技大學聯合推出圖生視頻模型“Follow-Your-Click”,已上架GitHub,代碼將于4月公開?;谳斎肽P偷膱D片,用戶只需要簡單點擊用于指定要移動的內容,再加上簡短的運動提示用于指定如何移動,就能讓圖片中原本靜態的區域動起來,一鍵轉換成視頻。

項目地址:https://github.com/mayuelala/FollowYourClick

論文地址:https://arxiv.org/abs/2403.08268

6、小米14 Ultra上線相冊AIGC編輯

昨天,小米官方宣布,小米相冊AIGC編輯功能正式上線小米14 Ultra手機,并將在本月內全量上線小米14、小米14 Pro和Redmi K70系列手機。

7、華為發布政務、城市大模型首批應用場景

在3月14-15日舉行的華為中國合作伙伴大會2024上,華為聯合伙伴發布政務大模型和城市大模型首批應用場景。華為基于城市智能中樞的架構,提供昇騰適配使能、自然語言大模型使能、多模態大模型使能、工具平臺開發使能等四大核心能力。華為聯合致遠互聯、華海智匯、國泰新點、南威軟件、泛微網絡等發布了政務大模型首批應用場景。聯合奧看科技、四方偉業、國泰新點、豐圖科技、數字冰雹、睿呈時代等發布了城市大模型首批應用場景。

8、華為系大模型創企獲千萬級天使輪融資

據36氪報道,近日深圳夸夸菁領科技有限公司獲千萬級天使輪融資,投資方為個人??淇漭碱I成立于2023年,主要為企業和政府客戶提供基于AI大模型的新型用工模式,夸夸菁領以華為盤古大模型為基底,為“數智員工”提供通識教育;而后通過與人力資源行業、法律等行業合作為其喂養行業數據,完成專業訓練;進入企業或政府單位后,接受數月的流程培訓和場景化訓練便可正式投入應用。

9、AI驅動美圖2023年凈利潤大漲233.2%、

今天,美圖披露2023年業績報告:總收入27億元,同比增長29.3%。經調整后歸屬于母公司權益持有人凈利潤3.7億元,同比增長233.2%。總收入與凈利潤增長主要得益于AI推動主營業務收入增長。美圖用戶每天處理數億份圖片和視頻,約83%都用到了泛AI功能。

10、生數科技多模態大模型通過國家備案

今天,大模型創企生數科技宣布,生數科技多模態大模型正式通過國家《生成式人工智能服務管理暫行辦法》備案,這也是國內首個原生多模態大模型通過國家備案。

11、海信發布自研星海大模型

今天,海信發布自研星海大模型。海信視像科技總裁李煒透露,星海大模型基于海信自有的千萬級別高質量語言、圖像等數據進行訓練,在權威測評榜單C-Eval上位列第二,電視行業第一。

12、杭州發布首個成果轉化領域大模型

昨天,杭州市科技局、杭州技術轉移轉化中心共同發布了國內首個成果轉化領域大模型“智者大模型1.0”。杭轉中心相關負責人介紹,“智者大模型1.0”的主要功能是企業的智能畫像、成果的智能化評價、供需的智能化匹配等。

13、漢王科技天地大模型通過國家備案

今天,漢王科技天地大模型正式通過國家《生成式人工智能服務管理暫行辦法》備案。天地大模型于去年10月正式發布,具備多模態、語義理解、邏輯推理、數學計算、知識搜索、工具調用、內容生成、多語言和多輪對話九大基礎能力。

14、首個區域實時文生圖架構發布

昨天,開源平臺Hugging Face上的論文,提出了一種實時、交互式的文本到圖像生成系統StreamMultiDiffusion。論文的摘要部分顯示,這是第一個基于區域的實時文本到圖像生成框架。研究人員通過穩定快速推理技術將模型重組為新提出的多提示流批處理架構,其全景圖生成速度比現有解決方案快10倍,并且在基于區域的文本到圖像合成中的生成速度為1.57 FPS單個RTX 2080 Ti GPU。

項目地址:https://github.com/ironjr/StreamMultiDiffusion

論文地址:https://arxiv.org/abs/2403.09055

15、3D視覺語言動作生成世界模型發布

今天,在預印本平臺arXiv上,一篇論文介紹了3D視覺-語言-動作生成世界模型3D-VLA。研究人員通過引入一系列新的具體化基礎模型來提出3D-VLA,這些模型通過生成世界模型無縫鏈接3D感知、推理和行動。具體來說,3D-VLA 構建在基于3D的大語言模型之上,并引入了一組交互令牌來與具體環境進行交互。研究保留數據集的實驗表明,3D-VLA提高了具體環境中的推理、多模態生成和規劃能力。

項目地址:https://huggingface.co/papers/2403.09631

論文地址:https://arxiv.org/abs/2403.09631

16、預計今年中國AI訓推一體機市場空間168億元

在3月14-15日舉辦的華為中國合作伙伴大會上,華為公司董事ICT產品與解決方案總裁楊超斌透露,預計2024年中國區AI訓推一體機的市場空間為168億元。楊超斌稱,2023年昇騰的模型和算子覆蓋率、鯤鵬的應用覆蓋率均快速提升,今年將發展超過50家鯤鵬和昇騰的伙伴。

17、歐盟調查大型科技公司對生成式AI的使用

昨天,歐盟宣布委員會已根據《數字服務法(DSA)》正式向Bing和谷歌搜索兩大超大型在線搜索引擎以及Facebook、Instagram、Snapchat、TikTok、YouTube和X六大在線平臺,發送有關生成式人工智能風險信息的請求。委員會要求這些服務平臺提供更多信息,說明各自針對與生成式AI相關風險的緩解措施,例如AI提供虛假信息的所謂“幻覺”、深度偽造品的病毒式傳播等。有關公司必須在2024年4月5日之前向委員會提供有關選舉保護相關問題的信息,并在2024年4月26日之前向委員會提供其余問題的信息。

18、OpenAI模型驅動人形機器人自主對話

前日晚間,人形機器人獨角獸Figure發布了機器人Figure 01的最新進展視頻。在OpenAI大模型的驅動下,它能自主與人對話、理解意圖并執行決策。據Figure的AI技術負責人稱,視頻中的行為都是機器人自己學習并完成的,沒有任何人為操控,而且視頻是標準的“1倍速”。Figure創始人稱,OpenAI提供了視覺推理和語言理解能力,而Figure的神經網絡則負責實現快速、靈敏的機器人動作。

19、OpenAI官宣新的國際新聞機構合作伙伴

昨天,OpenAI宣布與國際新聞機構Le Monde和Prisa Media合作,將法語和西班牙語新聞內容引入ChatGPT。在接下來的幾個月中,ChatGPT用戶將能夠通過精選的摘要,與這些發布商的相關新聞內容進行交互,從其新聞網站訪問其他信息或相關文章。

20、Sora將于年內推出 擬增加語音功能

據《華爾街日報》前天報道,OpenAI CTO米拉·穆拉蒂(Mira Murati)在采訪中透露,文生視頻工具Sora將在今年內發布,未來計劃增加語音功能。她稱,時長20秒、分辨率720P的視頻僅需幾分鐘就能生成。

21、阿爾特曼稱被起訴后與馬斯克互發短信

據《商業內幕》報道,昨天,OpenAI CEO阿爾特曼在接受采訪時稱,當馬斯克對OpenAI及幾位聯合創始人提起訴訟,他給馬斯克發送了一條“無關緊要的”短信。記者詢問他是不是發了類似“WTF”的內容,他說比那個要友善一些。在那之后,他們又“互相發送了一些表情符號”。

22、微軟Copilot安全版4月1日全球發布

昨天,微軟宣布Copilot for Security(國際版)將于4月1日在全球范圍內正式發布。這是全球信息安全領域首個獨立的生成式AI解決方案,面向安全和IT專業人員,能全面洞察安全態勢,更快地采取行動,并增強團隊專業技能。據介紹,微軟Copilot for Security每天處理超過78萬億超大規模的安全信號,資深安全專業人員在使用Copilot后工作效率提高了22%,任務準確率提高了7%。

23、微軟Copilot Pro介紹中出現GPT-5

據MSPowerUser昨天報道,微軟Copilot Pro介紹中出現GPT-5字眼,顯示開通可以優先訪問GPT-5 Turbo。微軟廣告和網絡服務首席執行官Mikhail Parakhin回應稱,這是一個拼寫錯誤,應該是GPT-V。也有網友發現,在其他購買頁面的詳情中所寫的是GPT-4 Turbo。截至目前,微軟仍未修復該錯誤。

24、谷歌發布通用游戲AI智能體

前天晚間,谷歌DeepMind團隊發布了可擴展、可指導的多世界智能體SIMA(Scalable Instructable Multiworld Agent),該智能體可以遵循自然語言指令在各種視頻游戲環境中執行任務,從個別游戲轉向通用的、可指導的游戲AI智能體。據介紹,SIMA適用于3D虛擬環境,可通過語言接口將先進的AI模型能力轉化為有用的現實世界行動。

25、谷歌發布讓人物照片說話的方法VLOGGER

昨天,谷歌發布了一種從單個人物輸入圖像,生成基于文本和音頻驅動的人類說話視頻的方法VLOGGER。它基于生成擴散模型,包括一種隨機的人物到3D動作擴散模型,以及一種新的基于擴散的架構,將文本到圖像模型與時間和空間控制相結合。據介紹,VLOGGER可以生成高質量、長度可變的視頻,并通過人臉和身體的高級表達進行控制。

項目主頁:

https://enriccorona.github.io/vlogger/

論文地址:

https://enriccorona.github.io/vlogger/paper.pdf

26、百度推出首個消費者組織數字人

據百度營銷中心微信公眾號前天發文,百度聯合深圳市消費者委員會推出全國首個消費者組織數字人“鵬維維”。數字人“鵬維維”由百度AIGC創意生成平臺擎舵提供數字人建模、語音克隆、動作捕捉、AI和算法驅動等技術支持。擎舵基于文心一言底層大數據模型,利用數字人建模技術和語音克隆技術,實現了對真人和語音1:1還原,讓數字人帶給用戶更接近真人的交流體驗。

27、阿里巴巴全球數學競賽首次向AI開放

據達摩院DAMO微信公眾號發文,昨日,2024阿里巴巴全球數學競賽開啟報名。今年賽事首次向AI開放,邀請全球AI大模型挑戰競賽難度試題。本屆大賽初賽時間為4月13日-14日,參賽的AI模型將與人類選手一同在線上應對初賽試題的挑戰,組委會將重點評估AI模型對題目的理解、邏輯推理準確性和問題解決能力。為了確保公平競賽,避免人類替考的情況出現,參賽者需要在開賽前提交模型代碼,供校驗復現。最終得分排名前三的AI團隊將依次獲得獎金10000美元、5000美元、2000美元。

28、零一萬物API上線 支持輸入30萬漢字

昨日,大模型創企零一萬物發布了Yi大模型API(應用程序接口)開放平臺。據悉,此次 API 開放平臺提供以下模型:Yi-34B-Chat-0205,支持通用聊天、問答、對話、寫作、翻譯等功能;Yi-34B-Chat-200K,支持200K 上下文,多文檔閱讀理解、超長知識庫構建;Yi-VL-Plus多模態模型,支持文本、視覺多模態輸入,中文圖表體驗超過GPT-4V。

API開放平臺鏈接:

https://platform.lingyiwanwu.com

29、智譜AI獲北京市AI產業投資基金參投融資

據騰訊科技昨日報道,大模型創企智譜AI已于今年初完成新一輪融資,北京市AI產業投資基金參與投資,這也是該基金成立以來投資的第一家大模型公司。智譜AI未透露投資金額。

30、王小川稱百川不走Sora路徑

據騰訊科技昨日報道,AI創企百川智能CEO王小川在接受其采訪時談道,公司的工程師在技術會上試著說服他嘗試文生視頻,但他認為像Sora之類的文生視頻模型既不靠近AGI理想,也不靠近現實場景,并明確拍板:百川不走Sora路徑。王小川認為,現在的Sora不懂物理規律,沒有深入到后面的分子、細胞相變,只是模擬引擎,因此Sora要把物理學全都學會才會變成世界引擎。他還稱,Sora的高度、突破性、應用價值低于GPT。

31、曠視透露“大模型+機器人”計劃

據曠視MEGVII微信公眾號發文,前天,中共中央政治局常委、國務院總理李強在北京調研,曠視聯合創始人、CEO印奇作為北京市AI企業代表參加座談會,匯報了公司在大模型領域的技術創新思路。印奇稱,曠視將推動多模態大模型的技術創新和行業應用,發揮在軟硬結合方面的優勢,圍繞“大模型+機器人”的發展方向,推動AI為實體產業創造價值。

32、傳拼多多不做大模型布局

據深網騰訊新聞昨日報道,拼多多內部人士透露,公司在AI大模型上暫時沒有布局,內部確實在做AI智能客服,但算不上大模型量級。拼多多何時布局生成式AI及大模型,可能取決于創始人黃崢對AI的判斷。業內一個未經證實的消息是,卸任拼多多所有職務后,黃崢在哥倫比亞大學攻讀AI博士學位。

33、網絡芯片創企篆芯獲2億元融資

據硬氪昨日報道,篆芯半導體南京有限公司日前完成2億元A2輪融資,此次融資由隆湫資本領投,睿悅投資、檸盟投資、君盛資本、卓源亞洲、華方資本等多家新老股東跟投。本輪融資資金將用于技術研發和產品升級。據悉,篆芯于2021年成立,主要業務是為AI、云計算、萬物互聯時代打造網絡芯片,服務國內主流的網絡設備提供商。篆芯即將推出第一款芯片“蘭亭”,其具備高性能、可編程交換的特性,在云計算數據中心、園區網、核心骨干網等關鍵基礎設施中均可適配。

34、英偉達將推出生成式AI專業認證

據英偉達微信公眾號前天發文,英偉達即將推出一項新的生成式AI專業認證,助力開發者在這一重要領域證明自身技術實力。這項認證將在3月18日至21日舉行的GTC大會上正式推出,同時提供現場和線上的相關培訓課程。目前新推出的專業認證計劃包含兩項入門級(Associate-level)生成式AI認證,這兩項認證專注于考察對大語言模型和多模態工作流技能的掌握程度。

35、傳軟銀考慮投資法國創企Mistral AI

據彭博社昨日援引知情人士消息報道,軟銀集團正在探索對法國大模型創企Mistral AI的潛在投資。據稱,軟銀已表示有興趣在Mistral下一次融資時為其提供支持,任何交易都有可能使Mistral的估值超過20億美元。雙方的商議仍在進行中,目前還不能確定是否會達成協議。軟銀和Mistral的代表拒絕置評。

36、Claude 3 Haiku正式上線

昨日,AI大模型創企Anthropic發布了Claude 3 Haiku,這是同系列中速度最快且最實惠的型號,該模型現已與Sonnet和Opus一起在Claude API和claude.ai上為Claude Pro訂閱者提供。

37、歐盟議會批準全球首個AI法案

據VentureBeat報道,昨日,歐盟議會批準了《人工智能法案》(EU AI Act),這是全球首部全面監管AI的法規。這部法案誕生于2021年,將AI技術分為不同的風險類別,從“不可接受”到高、中和低四個級別。法案根據不同的風險等級對AI的不同用途進行監管,違規者最高將面臨其全球營收7%的罰款。該法案仍需要獲得歐盟理事會的批準,如果通過將于今年5月底正式立法生效。

法案地址:

https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai

38、創企Cerebras發布最快AI芯片WSE-3

前天晚間,AI芯片創企Cerebras發布了Wafer Scale Engine 3(WSE-3),其將現有最快AI芯片的世界紀錄加倍。在相同的功耗和價格下,WSE-3的性能是之前的錄保持者Cerebr的兩倍。WSE-3使用臺積電的5nm工藝打造,包含4萬億個晶體管、90萬個AI核心、44GB片上SRAM,外部存儲器為1.5TB、12TB或1.2PB,峰值性能為125 FP16 PetaFLOPS。該芯片能訓練高達24萬億個參數的AI模型,其打造的集群規模達2048個CS-3系統。

39、AI創企Kolena推出大模型測試驗證平臺

據VentureBeat報道,AI創企Kolena昨日推出AI測試平臺,用于測試和驗證大模型的速度和準確性。該系統包括對數據質量、模型的測試,以及數據漂移和模型退化的監控,并提供調試功能。據悉,Kolena成立于2021年,由前亞馬遜高級工程經理創立。

40、AI基礎設施平臺Together AI晉升獨角獸

據路透社報道,英偉達支持的AI基礎設施創企Together AI近日完成1.06億美元融資,由Salesforce領投,Coatue Management等老股東跟投。自去年秋天以來,隨著投資者紛紛支持生成式AI初創公司,其估值翻了一番,此次融資對Together AI的估值為12.5億美元。