百度騰訊推出視頻生成模型;傳美團AI視覺中心負責人離職;微軟研究院回應關閉傳言丨AIGC大事日報

1、Meta重組兩大AI部門,正研發Llama 3

2、微軟研究院回應關閉傳言

3、Runway推出多頭運動筆刷

4、夸克App上線“元知”、“聽記”等AI應用

5、騰訊發布視頻生成模型VideoCrafter2

6、百度發布視頻生成模型UniVG

7、國內首個網絡安全大模型評測平臺發布

8、訊飛1月30日發布星火大模型V3.5

9、傳美團AI平臺視覺中心負責人魏曉林離職

10、智源等提出視覺版Mamba方法Vim

11、成都發布AI新政 最高獎勵1000萬元

12、TikTok內測AI生成歌曲功能

13、韓國Kakao推出多模態大模型Honeybee

14、Rabbit宣布與AI搜索引擎Perplexity合作

1、Meta重組兩大AI部門,正研發Llama 3

今日,Meta CEO馬克·扎克伯格(Mark Zuckerberg)于社交平臺Instagram發布視頻,宣布將兩個主要的AI研究部門FAIR和生成式AI團隊重組,它們將“更緊密地結合”以支持開源AGI的長期目標。Meta目前正在訓練下一代模型Llama 3,并且正在構建大規模的計算基礎設施,到今年年底將達到35萬個H100,算上其他GPU則總共擁有近60萬個H100的等效算力。同時,Meta在AI驅動的計算設備方面很快會有更多進展。

2、微軟研究院回應關閉傳言

據界面新聞報道,針對微軟計劃關閉微軟亞洲研究院的傳聞,微軟全球資深副總裁、微軟研究院負責人Peter Lee昨日回應稱,目前沒有關于關閉微軟亞洲研究院的討論或主張,“我們一如既往地支持微軟亞洲研究院及其世界級的研究工作,對未來的研究計劃充滿期待?!蔽④浌究偛眉娑聲敝飨疊rad Smith則強調:“歷史的經驗表明,從世界范圍內汲取思想才能夠獲得成功?!o欄’與‘把控’固然重要,而‘參與’的重要性同樣不容忽視?!贝送鈸私?,微軟研究院也在溫哥華成立了新的研究中心,并在持續擴招人才。

3、Runway推出多頭運動筆刷

昨日晚間,AI視頻創企Runway宣布Gen-2模型中的運動筆刷(Motion Brush)功能升級為多頭運動筆刷(Multi Motion Brush),可以獨立控制視頻中多個區域的運動,讓不同的物體、內容分別運動。該功能在免費帳戶中也提供體驗。

體驗地址:runwayml.com

4、夸克App上線“元知”、“聽記”等AI應用

今日,夸克App基于自研大模型能力升級多個功能板塊和智能工具,推出搜索問答產品“元知”,上線夸克PC版以及夸克“聽記”等新產品。用戶可在“元知”搜索結果中,查看生成式AI總結提煉出的回答內容,包含圖文、視頻等多種形式??淇恕奥犛洝庇糜谝粢曨l內容整理,支持中、英、粵等主流語言和方言,語音筆記可以在夸克多端同步保存??淇司W盤提供AI自然語言搜索功能,輸入簡單描述詞就能快速找到照片、圖片、文檔等資料,夸克網盤播放器能夠自動生成AI字幕,實現視頻轉文字以及導出視頻中的PPT。

5、騰訊發布視頻生成模型VideoCrafter2

昨日,騰訊AI實驗室發布了視頻生成模型VideoCrafter2,相關論文同日發表在arXiv。該模型研究了利用低質量視頻和合成高質量圖像獲得高質量視頻模型的可行性,通過使用高質量圖像對空間模塊進行微調,在不降低運動質量的情況下,將分布轉移到更高質量的視頻上,克服了高質量視頻擴散模型的數據限制。

項目主頁:

ailab-cvc.github.io/videocrafter2

論文地址:

arxiv.org/pdf/2401.09084.pdf

Demo試用:

discord.gg/RQENrunu92

6、百度發布視頻生成模型UniVG

昨日,來自百度的團隊發布了視頻生成模型UniVG,這是一種統一模式視頻生成系統,能夠以文本和圖像的任意組合作為輸入。團隊將系統內視頻生成模型的多個任務,重新劃分為高自由度生成和低自由度生成兩類,并針對不同自由度采用不同的生成方式。

項目主頁:

univg-baidu.github.io

論文地址:

arxiv.org/pdf/2401.09084.pdf

7、國內首個網絡安全大模型評測平臺發布

業界首個網絡安全大模型評測平臺SecBenc今日正式發布,該平臺由騰訊朱雀實驗室和騰訊安全科恩實驗室,聯合騰訊混元大模型、清華大學江勇教授/夏樹濤教授團隊、香港理工大學羅夏樸教授研究團隊、上海人工智能實驗室OpenCompass團隊共同建設,主要解決開源大模型在網絡安全應用中安全能力的評估難題,旨在為大模型在安全領域的落地應用選擇基座模型提供參考,加速大模型落地進程;同時,通過建設安全大模型評測基準,為安全大模型研發提供公平、公正、客觀、全面的評測能力,推動安全大模型建設。

8、訊飛1月30日發布星火大模型V3.5

科大訊飛今日在深交所互動易問答中透露,基于算力底座“飛星一號”平臺的訊飛星火認知大模型V3.5目前已經完成訓練,相比V3.0,在邏輯推理、文本生成、數學答題及小樣本學習能力等方面大幅提升??拼笥嶏w將在1月30日下午2:00舉辦訊飛星火認知大模型V3.5升級發布會,在科大訊飛視頻號等平臺在線直播。

9、傳美團AI平臺視覺中心負責人魏曉林離職

據AI科技評論今日報道,現任美團AI平臺視覺中心負責人魏曉林將離職,結束4年6個月的美團生涯。據悉,魏曉林深耕計算機視覺領域17年,在職期間,魏曉林制定了計算機視覺/AI戰略和發展路線圖,領導美團視覺中心開發AI系統。在魏曉林的帶領下,美團AI平臺視覺中心開發并部署了數千個AI API和SDK。他還組織研發了部署在美團自動配送車隊、用于自動駕駛的高性能CV模型,以及美團地圖街景自動處理和自動更新的管道。

10、智源等提出視覺版Mamba方法Vim

昨日,來自華中科技大學、地平線、智源研究院等機構的研究者提出了Vision Mamba(Vim),相關論文發表于arXiv。論文提出Vision Mamba塊,結合了用于數據依賴的全局視覺上下文建模的雙向SSM和用于位置感知視覺識別的位置嵌入。 據介紹,在對分辨率為1248×1248的圖像進行批量推理時,Vim比成熟的視覺Transformer模型DeiT快2.8倍,并節省了86.8%的GPU內存。Mamba是去年12月推出的一種新架構,在語言任務上匹配Transformer性能,具有線性復雜度和5倍推理吞吐量。

項目主頁:

github.com/hustvl/Vim

論文地址:

arxiv.org/pdf/2401.09417.pdf

11、成都發布AI新政 最高獎勵1000萬元

昨日,成都市經信局市新經濟委等7部門聯合印發《成都市進一步促進人工智能產業高質量發展的若干政策措施》,提出14條政策措施?!墩叽胧诽岢?,鼓勵企業、科研機構研制AI開發框架,一次性給予最高250萬元的資金補貼。對取得國家科技重大專項等成果并在蓉落地轉化的,給予最高1000萬元經費支持。支持AI企業上市融資,給予最高100萬元獎勵。

12、TikTok內測AI生成歌曲功能

據The Verge今日報道,海外版抖音TikTok正在測試AI生成歌曲功能AI Song,由大型語言模型Bloom提供支持。用戶發布視頻時在文本框中寫下歌詞,AI Song將會生成歌曲,并且用戶可以切換歌曲的流派。

13、韓國Kakao推出多模態大模型Honeybee

據《韓國時報》報道,韓國科技巨頭Kakao今日宣布,公司已開發出一種名為“蜜蜂”(Honeybee)的多模態大語言模型。據Kakao稱,“蜜蜂”能夠同時理解圖像和文本,回復與圖像和文本內容混合相關的咨詢,該模型代碼已在開源社區GitHub上發布。

14、Rabbit宣布與AI搜索引擎Perplexity合作

AI硬件創企Rabbit今日在社交平臺X宣布與AI搜索引擎Perplexity合作,利用后者的技術增強rabbit OS的自然語言搜索功能,為所有AI硬件R1用戶提供支持。Rabbit還宣布R1開啟第6批共5萬臺預售,此前5批共5萬臺已售罄。