1、OpenAI前開發者關系主管加入谷歌

2、OpenAI發布首支Sora制作的MV

3、DALL-E 3灰度測試局部重繪功能

4、Microsoft 365用戶將優先使用GPT-4 Turbo

5、Anthropic發現大模型長文本漏洞

6、開源版AI程序員SWE-agent發布

7、出門問問通過港交所聆訊

8、元象首個MoE大模型開源

9、2024年全國數據工作明確八項重點任務

10、網信辦生成式AI服務備案信息3月新增23家

11、2024年Top100 AI公司報告發布

12、亞馬遜為創企提供AI大模型免費積分

13、雅虎收購Ins聯創成立的AI新聞平臺Artifact

14、創企Hailo發布邊緣側生成式AI芯片Hailo-10

15、Stability AI前CEO稱不喜歡這份工作

16、谷歌新論文:潛在擴散模型并非越大越好

17、騰訊開源視頻生成工具MuseV

1、OpenAI前開發者關系主管加入谷歌

今日,OpenAI前開發者關系主管Logan Kilpatrick在其社交平臺X宣布,將加入谷歌領導AI Studio的產品并支持Gemini API,“將把谷歌打造為開發人員構建AI的最佳家園”。他在OpenAI任職一年半時間,并于3月1日宣布離職。

2、OpenAI發布首支Sora制作的MV

今日,OpenAI發布了首支由Sora生成的MV,其中音樂由由藝術家August Kamp制作,畫面是該藝術家使用Sora輔助完成。August Kamp評價道:“這就是我認為Sora這個工具的特別之處。我可以與大家分享曾經被我獨自鎖在腦海中的畫面。這首歌在我心中一直都是這個樣子,只是現在我可以展示給大家看了?!?/p>

3、DALL-E 3灰度測試局部重繪功能

今日,據社交平臺X博主@歸藏發文,OpenAI已開始灰度測試DALL-E 3的局部重繪功能,用戶可點擊生成的圖片進入編輯頁面,用畫筆涂抹想要修改的區域,并在右側對話框輸入想要修改的內容即可生成。

4、Microsoft 365用戶將優先使用GPT-4 Turbo

今日,微軟宣布向云生產力平臺Copilot for Microsoft 365用戶提供兩項重要更新:優先訪問GPT-4 Turbo模型、取消對話數量和長度的限制同時增加文件上傳。此外,本月晚些時候微軟將向Copilot for Microsoft 365用戶提供Microsoft Designer中擴展的圖像生成功能,包括高峰時段的優先訪問。

5、Anthropic發現大模型長文本漏洞

今日,大模型創企Anthropic發布論文,提出一種“越獄”技術,可以用來躲避大型語言模型開發人員設置的安全護欄,對Claude 2、GPT-3.5、GPT-4、Llama 2和Mistral 7B等多個主流模型都有效。該方法利用長上下文窗口,攻擊者輸入一個以數百個虛假對話為開頭的提示,提示中包含有害的請求,就能使大模型產生潛在有害的反應。

論文地址:

https://cdn.sanity.io/files/4zrzovbb/website/af5633c94ed2beb282f6a53c595eb437e8e7b630.pdf

6、開源版AI程序員SWE-agent發布

昨日,普林斯頓團隊開源發布了Agent打造的AI程序員SWE-agent,它能讓GPT-4等大模型輕松編輯和運行代碼,在SWE-bench測試集上獲得與首個AI程序員Devin相似的準確度,平均耗時93秒。

項目主頁:

https://swe-agent.com/

開源地址:

https://github.com/princeton-nlp/SWE-agent

7、出門問問通過港交所聆訊

昨日,生成式AI創企出門問問正式通過港交所聆訊,并披露聆訊后資料集,即將于主板掛牌上市。招股書顯示,本次IPO募資凈額將用于持續提高建模技術,以進行模型訓練,通過在未來數年引進世界領先的技術和人才,對底層基礎模型進行垂直優化,并改進解決方案的現有程序算法;用于解決方案開發及營銷;將分配至用于尋求戰略聯盟、投資及收購,以實施解決方案發展的長期增長策略等。

聆訊后資料集:

https://www1.hkexnews.hk/app/sehk/2023/105965/documents/sehk24040204425_c.pdf

8、元象首個MoE大模型開源

今日,據元象XVERSE微信公眾號發文,元象發布XVERSE-MoE-A4.2B大模型 ,采用業界最前沿的混合專家模型架構,激活參數4.2B,效果即可達到13B模型水準。據介紹,XVERSE-MoE-A4.2B實現了極致壓縮,相比XVERSE-13B-2僅用30%計算量,并減少50%訓練時間。在多個權威評測中,元象MoE效果大幅超越Gemma-7B、Mistral-7B、Llama2-13B等開源模型,并接近超大模型Llama1-65B。該模型全開源,無條件免費商用。

ModelScope魔搭開源地址:

https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B

9、2024年全國數據工作明確八項重點任務

據國家數據局微信公眾號昨日發文,首次全國數據工作會議于4月1日到2日在北京召開,會上明確了八項重點任務:健全數據基礎制度、提升數據資源開發利用水平、以數字化賦能高質量發展、促進數據科技創新發展、優化數據基礎設施布局、強化數據安全保障能力、提升數據領域國際合作水平、發揮試點試驗的引領作用。

10、網信辦生成式AI服務備案信息3月新增23家

昨日,中國網信網于官網發布關于生成式AI服務已備案信息的公告。網信部門會同相關部門按照《生成式人工智能服務管理暫行辦法》要求,有序開展生成式AI服務備案工作,已備案信息將定期更新。根據最新文件,3月共有23個大模型通過備案。

11、2024年Top100 AI公司報告發布

昨日,技術市場情報平臺CB Insights發布了2024年Top100的AI公司報告,關注來自16個國家/地區從事大模型、AI基礎設施等最有前途的100家公司。據介紹,評選標準包括交易活動、行業合作伙伴關系、團隊實力、投資者實力、專利活動等,還分析了CB Insights對軟件買家的采訪,并深入研究了初創公司提交的分析師簡報。根據融資金額來看,OpenAI、Anthropic、Databricks占據前三;根據估值與員工人數的比值來看,Sakana AI、Mistral AI、Anthropic和OpenAI位列前四。

完整報告地址:

https://www.cbinsights.com/learn/ai-100-2024

12、亞馬遜為創企提供AI大模型免費積分

據路透社昨日報道,亞馬遜云科技(AWS)在采訪中稱,公司已擴大針對初創公司的免費積分計劃,以降低使用主要AI模型的成本,提高其AI平臺Bedrock的市場份額。為了吸引創企客戶,亞馬遜現在允許其云積分覆蓋其他提供商的模型的使用,包括Anthropic、Meta、Mistral AI和Cohere。

13、雅虎收購Ins聯創成立的AI新聞平臺Artifact

雅虎昨日宣布,已于3月29日完成對AI新聞平臺Artifact的收購。Artifact將不再作為獨立APP運行,其AI驅動的個性化技術及其他功能將在未來幾個月內集成到雅虎新聞等。Artifact由社交平臺Instagram聯合創始人Kevin Systrom和Mike Krieger于2023年1月創立,主要業務是提供AI驅動的個性化新聞推薦。今年1月,Artifact宣布關停服務。

14、創企Hailo發布邊緣側生成式AI芯片Hailo-10

今日,以色列芯片制造商Hailo宣布擴大C輪融資,獲得1.2億美元的追加資金。同時,Hailo宣布推出高性能邊緣側生成式AI芯片Hailo-10,使用戶可以在本地擁有和運行生成式AI應用程序,而無需采用云服務。據介紹,在主流生成式AI平臺上,Hailo-10可以在低于5W的功率下以每秒高10個Token的速度運行Llama2-7B;在運行文生圖模型Stable Diffusion 2.1時,Hailo-10在相同的低功耗范圍內每張圖像的額定生成速度不到5秒。

15、Stability AI前CEO稱不喜歡這份工作

據《商業內幕》昨日報道,于3月辭職的Stability AI前CEO埃馬德·莫斯塔克(Emad Mostaque)在采訪中談道,擔任CEO并不是一件有趣的事,直言自己一直不喜歡這份工作。他引用了馬斯克對CEO職責的評價,“創辦一家公司就像凝視深淵并吃玻璃”。莫斯塔克稱,自己特別擅長幫助創意人員、開發人員和研究人員發揮設計系統的潛力,但不會處理人力資源、運營和業務發展事務,還談到自己擔任CEO期間患有阿斯伯格癥和多動癥。

16、谷歌新論文:潛在擴散模型并非越大越好

來自谷歌、霍普金斯大學的團隊昨日在arXiv上發表論文,研究了潛在擴散模型(LDM)的擴展特性,重點是其采樣效率。通過對已建立的文本到圖像擴散模型進行實證分析,作者對模型大小如何影響不同采樣步驟的采樣效率進行了深入研究。研究結果顯示,在給定推理預算的情況下,較小的模型在生成高質量結果方面經常優于較大的模型。

論文地址:

https://arxiv.org/pdf/2404.01367.pdf

17、騰訊開源視頻生成工具MuseV

3月27日,來自騰訊的團隊在GitHub上開源了一個基于擴散的虛擬人視頻生成框架MuseV,能夠生成基于視覺條件并行去噪的無限長度和高保真虛擬人類視頻。該方法技術論文暫未發布,直接開源了訓練好的模型和部署運行的代碼,主頁顯示訓練代碼也即將推出。

項目主頁:

https://github.com/TMElyralab/MuseV