庫克稱蘋果今年引入生成式AI;文心一言數字分身功能內測;商湯大模型體系日日新4.0發布丨AIGC大事日報

1、百度文心一言內測數字分身功能

2、商湯發布日日新SenseNova 4.0

3、谷歌Bard、搜索引擎新增文生圖功能

4、谷歌Gemini Pro擴展至中文等46種語言

5、谷歌地圖引入生成式AI功能

6、亞馬遜推出對話式AI購物助手Rufus

7、庫克:蘋果將在今年晚些時候推出生成式AI功能

8、阿里發布手機操作智能體框架Mobile-Agent

9、巨人網絡游戲大模型GiantGPT完成備案

10、網安局通報AI生成造謠文章案

11、萬事達推出欺詐檢測AI大模型

12、AI基礎設施創企Astera Labs計劃3月IPO

13、研究表明AI可以從嬰兒視角學習語言

1、百度文心一言內測數字分身功能

據百度微信公眾號發文,文心一言APP正在內測數字分身新功能,今日起,iOS和安卓用戶可升級新版本免費試用?;谠摴δ?,用戶只需一張照片、錄制三句語音,即可創建專屬數字分身,并且支持個性化定義名稱、聲音、MBTI性格等,用戶可選擇是否公開自己的數字分身。

2、商湯發布日日新SenseNova 4.0

據商湯科技微信公眾號發文,今日,商湯大模型體系日日新SenseNova?4.0發布,其知識覆蓋面、推理能力、長文本理解力、代碼生成能力等得到提升。其中,日日新·商量大語言模型-通用版本(SenseChat V4)支持128K語境窗口長度,綜合整體評測成績水平比肩GPT-4,相較GPT-3.5已經實現全?超越。商湯還推出了支持不同模態工具調用的日日新·商量大語言模型Function call & Assistants API版本,降低開發者使用大模型的門檻。

API申請網址:

https://platform.sensenova.cn/

3、谷歌Bard、搜索引擎新增文生圖功能

今日,谷歌宣布在聊天機器人Bard中推出由Imagen 2模型支持的文生圖功能。同時,谷歌推出新的文生圖工具ImageFX,支持用戶使用簡單的文本提示創建圖像,并提供新的提示修改建議。此外谷歌搜索和機器學習平臺Vertex AI也將提供Imagen 2驅動的圖像生成功能。

4、谷歌Gemini Pro擴展至中文等46種語言

今日,谷歌宣布聊天機器人Bard中的Gemini Pro模型將擴展至46種語言和238個國家/地區,其中包括簡體/繁體中文。

5、谷歌地圖引入生成式AI功能

今日,谷歌宣布在谷歌地圖中引入生成式AI功能,利用大模型分析地圖上超過2.5億個地點的詳細信息及超過3億貢獻者的社區意見,為用戶提供尋找的內容或目的地建議,該功能本周起在美國推出。

6、亞馬遜推出對話式AI購物助手Rufus

今日,亞馬遜于官網發布對話式AI購物助手Rufus,目前向一小部分客戶推出測試版,未來幾周將擴展至更多美國用戶。Rufus經過亞馬遜的產品目錄、用戶評論、社區回答和網絡信息的訓練,可以回答用戶關于購物需求和產品的問題,提供購買建議等。

7、庫克:蘋果將在今年晚些時候推出生成式AI功能

今日,蘋果CEO庫克在財報電話會議上稱,公司正在開發生成式AI軟件功能,這些功能將在“今年晚些時候”向客戶提供,“我認為蘋果在生成式AI和AI方面存在著巨大的機會,但我不想談更多細節?!?/p>

8、阿里發布手機操作智能體框架Mobile-Agent

1月30日,來自阿里和北京交通大學的團隊在arXiv上發表論文,提出了用于操作手機的智能體框架Mobile-Agent。據介紹,這是一個純視覺解決方案,不需要XML(可拓展標記語言)和系統元數據,其操作范圍不受限制,可進行多應用操作,配備多種視覺感知工具用于操作定位,且無需訓練,即插即用。目前,Mobile-Agent已經學會了阿里巴巴、谷歌地圖、TikTok等10個APP的操作,可以完成一些跨應用任務。

GitHub主頁:

https://github.com/X-PLUG/MobilAgent

論文地址:

https://arxiv.org/abs/2401.16158

9、巨人網絡游戲大模型GiantGPT完成備案

據游戲公司巨人網絡微信公眾號發文,巨人網絡正式完成游戲AI大模型GiantGPT的備案,成為游戲行業首家對外確認實現了此成果的企業,相關備案結果今日在上海正式公布。即日起,巨人網絡AI大模型GiantGPT的有關服務可以正式開展業務。據介紹,GiantGPT是專注于游戲業務的垂類大模型,結合巨人網絡自有數據與互聯網公共數據訓練,并針對角色演繹、情景推理與長期記憶等基礎能力進行優化。

10、網安局通報AI生成造謠文章案

2月1日,公安部網安局通報了一起利用AI發表造謠文章賺取傭金案件。網民王某在某APP上參加發布作品賺取傭金活動,因寫作水平有限,便依托某款手機軟件的AI題詞功能寫文章。王某在系統中輸入帶有“殺人、失蹤”等敏感字眼的提示詞,附以時間地點,就能自動生成博取眼球的文章。其利用AI編造的文字不僅駭人聽聞,而且很多地方還“明確”了事件發生的時間、地點,誤導讀者以為這些事就發生在本地,信息被大量網民點贊、留言、轉發,嚴重干擾社會秩序。目前,齊齊哈爾公安機關對王某處以罰款,同時責令刪除相關謠言。

11、萬事達推出欺詐檢測AI大模型

據CNBC今日報道,支付巨頭萬事達稱其已經建立了自研的生成式AI大模型Decision Intelligence Pro,以幫助銀行實時評估其網絡上的可疑??交易,確定它們是否合法,從而檢測并根除欺詐交易。據稱,該模型基于Transformer從頭開始構建,利用萬事達生態系統中的數據進行訓練,重點在于使AI理解“商家之間的關系”,而不是關注單詞和文本。萬事達網絡和情報業務部門總裁Ajay Bhalla稱,該模型進行欺詐檢測的過程僅需50毫秒,可以幫助金融機構將欺詐檢測率平均提高20%,在某些情況下最高能提高300%。

12、AI基礎設施創企Astera Labs計劃3月IPO

據外媒The Information今日報道,知情人士稱,英特爾支持的美國云計算與AI基礎設施創企Astera Labs一直在與潛在的投資者會面,計劃在3月由摩根士丹利和摩根大通牽頭進行IPO(首次公開募股),最早可能在本月公開招股書。據透露,Astera Labs今年預計產生2.5億至3億美元收入。該公司從2023年實現盈利,截至10月有200多名員工。2022年,Astera Labs的估值為31.5億美元。根據與其類似的上市公司Credo Technology的估值,其現在的估值可能達40億美元。

13、研究表明AI可以從嬰兒視角學習語言

今日,來自紐約大學的團隊在《科學》(Science)雜志發表論文,展示如何讓AI模型從一個嬰兒的角度去學習。研究團隊在頭戴攝像頭視頻上訓練了一個神經網絡CVCL,該網絡捕獲了來自澳大利亞的嬰兒Sam從6個月到25個月大所看見的片段,他每周佩戴攝像機2小時,約占其清醒時間的1%左右。研究團隊根據Sam的視頻建立了SAYCam-S數據集,從中選取了61個小時的錄像,包括60萬張視頻幀和3.75萬段經過轉寫的錄音,記錄了大約25萬個單詞實例以及對應的圖像。研究發現,即使數據有限,AI模型也能從數十個到數百個示例中獲取單詞到視覺之間的映射,而且能夠將零樣本泛化到新的視覺數據集,并實現多模態對齊。

論文地址:

https://www.science.org/doi/10.1126/science.adi1374