打開網(wǎng)易新聞 查看精彩圖片

知名蘋果爆料人Mark Gurman透露,蘋果AI有望在iOS 18.6系統(tǒng)中首次在中國(guó)大陸啟用部分功能,背后將由阿里巴巴(BABA.US)和百度(BIDU.US)提供技術(shù)支持。

OpenAI近期宣布以約30億美元收購(gòu)人工智能編碼助手Windsurf,此交易是其迄今為止最大的一筆收購(gòu),顯示出其在AI領(lǐng)域的雄心和實(shí)力。

過去一天,國(guó)內(nèi)外AI行業(yè)還有更多熱點(diǎn)可以關(guān)注,烏鴉君帶你一起看看。

大模型

1)英偉達(dá)全新開源自動(dòng)語(yǔ)音識(shí)別模型 Parakeet-TDT-0.6B-V2,語(yǔ)音轉(zhuǎn)錄能力再提升

英偉達(dá)推出的Parakeet-TDT-0.6B-V2模型在自動(dòng)語(yǔ)音識(shí)別領(lǐng)域取得了顯著進(jìn)展。該模型結(jié)合開源理念與商業(yè)應(yīng)用,提升了轉(zhuǎn)錄效率,能夠在一秒內(nèi)完成60分鐘音頻的轉(zhuǎn)錄,且其詞錯(cuò)誤率接近市場(chǎng)領(lǐng)先水平。

通過支持多種開發(fā)環(huán)境及優(yōu)化多款GPU硬件,該模型為開發(fā)者提供了強(qiáng)大的工具,助力多樣化的語(yǔ)音應(yīng)用場(chǎng)景。

2)Suno v4.5正式上線,僅限付費(fèi)用戶使用,生成歌曲延長(zhǎng)至8分鐘

Suno音樂生成平臺(tái)推出了其最新模型v4.5,專為Pro和Premier付費(fèi)用戶設(shè)計(jì),顯著提升了音質(zhì)、風(fēng)格多樣性和用戶體驗(yàn)。新版本支持更廣泛的音樂風(fēng)格,增強(qiáng)了聲線表現(xiàn)和音效層次,同時(shí)延長(zhǎng)了歌曲生成時(shí)長(zhǎng)至8分鐘。

盡管部分用戶對(duì)付費(fèi)限制表示遺憾,但也有人認(rèn)為這一創(chuàng)新值得訂閱。

3)Freepik 發(fā)布“F Lite”:一個(gè)為版權(quán)安全而構(gòu)建的開放 AI 圖像模型

Freepik最近推出了其文本到圖像生成模型“F Lite”,旨在為因版權(quán)問題而備受爭(zhēng)議的生成器提供合法且安全的替代方案。F Lite基于Freepik自有的商業(yè)授權(quán)圖像庫(kù)進(jìn)行訓(xùn)練,擁有約100億個(gè)參數(shù)。

盡管在生成插圖和矢量風(fēng)格作品方面表現(xiàn)出色,但在生成照片級(jí)逼真圖像時(shí)仍存在不足。

AI應(yīng)用

1)iOS18.6或?yàn)橹袊?guó)用戶啟用AI功能 國(guó)行蘋果AI或由阿里百度技術(shù)支持

知名蘋果爆料人Mark Gurman透露,蘋果AI有望在iOS 18.6系統(tǒng)中首次在中國(guó)大陸啟用部分功能,背后將由阿里巴巴(BABA.US)和百度(BIDU.US)提供技術(shù)支持。

據(jù)悉,百度的文心一言大模型將作為中國(guó)市場(chǎng)蘋果AI的核心云端智能引擎。與此同時(shí),為確保AI內(nèi)容符合國(guó)內(nèi)法規(guī),蘋果還將引入由阿里巴巴提供的審查機(jī)制,對(duì)AI生成內(nèi)容進(jìn)行本地合規(guī)審核。

2)Excel MCP Server上線 可通過Claude等客戶端直接操作Excel文件

一款名為Excel MCP Server的開源工具近日引發(fā)熱議。這款基于MCP模型開發(fā)的服務(wù)器,允許用戶通過AI助手直接操作Excel文件,無(wú)需安裝微軟Excel軟件即可實(shí)現(xiàn)高效的表格處理。

該工具功能強(qiáng)大,支持創(chuàng)建、讀取、修改Excel數(shù)據(jù),生成圖表和透視表,極大地方便了用戶的表格處理工作。

3)谷歌Gemini聊天機(jī)器人全新升級(jí):支持多圖上傳和圖像編輯功能

谷歌的Gemini聊天機(jī)器人最近進(jìn)行了重要的更新,新增了多圖上傳和AI圖像編輯功能。該更新目前已向部分用戶開放,允許在網(wǎng)頁(yè)端同時(shí)上傳多張圖片,并對(duì)AI生成的圖像進(jìn)行編輯。

盡管這些功能尚未在所有賬戶中完全開放,但它們?yōu)橛脩籼峁┝烁蟮膭?chuàng)作靈活性,提升了整體用戶體驗(yàn)。

4)新一代唇形同步工具KeySync發(fā)布:突破表情泄漏與遮擋難題

近日,一款名為KeySync的創(chuàng)新唇形同步工具正式亮相,迅速引發(fā)了視頻內(nèi)容創(chuàng)作領(lǐng)域的廣泛關(guān)注。

KeySync是一款創(chuàng)新的唇形同步工具,成功解決了AI唇形同步中的表情泄漏和嘴部遮擋問題。其獨(dú)特的兩階段框架設(shè)計(jì)使得唇部動(dòng)作更加自然和精準(zhǔn),適用于影視制作、動(dòng)畫、虛擬主播等多個(gè)領(lǐng)域。

KeySync不僅支持高分辨率視頻處理,還能自動(dòng)生成與音頻匹配的唇部動(dòng)畫,大幅提升工作效率。

5)Runway發(fā)布圖像一致性參考功能 Gen-4References 支持提取人物、場(chǎng)景或風(fēng)格特征及多圖混合

Runway最近推出的Gen-4References功能為其AI視頻生成模型增添了圖像一致性參考能力,使創(chuàng)作者能夠通過上傳參考圖像來(lái)提取人物、場(chǎng)景或風(fēng)格特征,從而在生成內(nèi)容中保持高度一致性。

這一功能支持多張圖像的混合生成,為視頻創(chuàng)作提供了更大的控制力與創(chuàng)意自由,極大地簡(jiǎn)化了設(shè)計(jì)流程,推動(dòng)了AI在影視制作領(lǐng)域的應(yīng)用。

6)Midjourney V7推出全新功能 “Omni-Reference”,讓圖像生成更靈活

Midjourney最近推出的“Omni-Reference”功能為圖像生成帶來(lái)了革命性的變化。它允許用戶對(duì)圖像元素進(jìn)行精確控制,支持多種對(duì)象生成和靈活的權(quán)重調(diào)整,從而提升創(chuàng)作的自由度和一致性。

此功能不僅適用于藝術(shù)創(chuàng)作,還能在游戲開發(fā)、廣告設(shè)計(jì)等多個(gè)領(lǐng)域發(fā)揮重要作用,展示出廣泛的應(yīng)用潛力。

7)Claude AI將升級(jí):網(wǎng)頁(yè)版醞釀支持MCP定制鏈接

近日,科技媒體TestingCatalog報(bào)道,Anthropic旗下的Claude網(wǎng)頁(yè)應(yīng)用將通過引入Model Context Protocol(MCP)進(jìn)行重大升級(jí)。這一新協(xié)議旨在打破Claude在谷歌服務(wù)方面的限制,預(yù)計(jì)將為用戶提供更靈活的使用體驗(yàn)。

MCP作為一種開放標(biāo)準(zhǔn),將簡(jiǎn)化大型語(yǔ)言模型與外部數(shù)據(jù)源和工具之間的通信,提升AI助手的集成能力。

8)Claude 移動(dòng)應(yīng)用即將推出語(yǔ)音模式,支持多種聲音選項(xiàng)

Claude 移動(dòng)應(yīng)用即將進(jìn)行重要升級(jí),推出備受期待的語(yǔ)音模式功能。該模式采用推按式對(duì)話,支持多種聲音選項(xiàng),并具備網(wǎng)頁(yè)搜索能力,搜索結(jié)果以要點(diǎn)形式呈現(xiàn),便于用戶理解和跟進(jìn)。

此外,用戶可以上傳文件作為上下文參考,提升了交互體驗(yàn)。

投融資情報(bào)

1)OpenAI同意以30億美元收購(gòu)AI編碼助Windsurf

OpenAI近期宣布以約30億美元收購(gòu)人工智能編碼助手Windsurf,此交易是其迄今為止最大的一筆收購(gòu),顯示出其在AI領(lǐng)域的雄心和實(shí)力。

Windsurf的技術(shù)在開發(fā)者社區(qū)中備受推崇,此次收購(gòu)可能會(huì)引發(fā)行業(yè)內(nèi)的廣泛討論,尤其是在OpenAI與其他AI編碼助手之間的競(jìng)爭(zhēng)關(guān)系上。

2)OpenAI 重返非營(yíng)利模式,終止?fàn)I利性實(shí)體控制機(jī)制

OpenAI 宣布重返非營(yíng)利模式,結(jié)束營(yíng)利性實(shí)體的控制,重組為公益公司。這一變動(dòng)回應(yīng)了外界對(duì)其商業(yè)化的擔(dān)憂,尤其是來(lái)自埃隆·馬斯克的批評(píng)。

新的治理結(jié)構(gòu)將確保社會(huì)效益透明,同時(shí)允許繼續(xù)吸引風(fēng)險(xiǎn)投資。OpenAI 計(jì)劃利用這一模式成為全球最大的慈善實(shí)體之一,預(yù)計(jì)2024年?duì)I收將突破20億美元。

整理/宇霽

PS:如果你對(duì)AI大模型領(lǐng)域有獨(dú)特的看法,歡迎掃碼加入我們的大模型交流群。