打開(kāi)網(wǎng)易新聞 查看精彩圖片

電腦自己彈出來(lái)一堆網(wǎng)頁(yè)?中病毒了吧!

打開(kāi)網(wǎng)易新聞 查看精彩圖片

但這回真不是,還有可能是 AI agent 在幫你查東西干活。

昨天世超去中關(guān)村智譜 OpenDay 湊了個(gè)熱鬧,近距離圍觀了智譜AI最新 AutoGLM 沉思的發(fā)布。

相對(duì)大家伙兒已經(jīng)很熟悉的各種 AI 助手只會(huì)打打嘴炮,智譜這 AI agent 已經(jīng)不僅僅局限在你問(wèn)我答上了,還能幫你直接動(dòng)手完成任務(wù),歸納總結(jié),提升答案的深度和廣度。

據(jù)說(shuō),AutoGLM 能先想再做,邊做邊想,聽(tīng)起來(lái)挺高深莫測(cè)的。

那具體效果咋樣?世超當(dāng)然也迫不及待地上手試了兩天。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

先下結(jié)論:AutoGLM 沉思功能上做的還不錯(cuò),它能幫大家把一個(gè)復(fù)雜問(wèn)題拆解,分步搜索,而且回答非常的全面。就是使用體驗(yàn)方面還有些提升空間。

有了它,感覺(jué)以后再也不怕老板讓寫年末總結(jié)報(bào)告了。

參考官網(wǎng)幾個(gè)用例,咱來(lái)看看具體測(cè)試效果是啥樣的。

事先說(shuō)好啊,世超把問(wèn)題扔給它就去開(kāi)會(huì)了,全程沒(méi)碰過(guò)一下鼠標(biāo)鍵盤。以下所有操作解釋權(quán)歸 AutoGLM 沉思所有。

先來(lái)問(wèn)問(wèn)它:人形機(jī)器人技術(shù)對(duì)未來(lái)生產(chǎn)模式會(huì)有什么顛覆性影響?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這問(wèn)題,換世超來(lái)也得想半天。但很快啊,AutoGLM 啪的一下就把思考步驟列出了一二三。

不僅能想,還敢干。AutoGLM 先打開(kāi)了知乎,去知乎搜了搜人形機(jī)器人在工廠環(huán)境下的最新案例。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

它甚至知道篩選信息。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

字太多不想看?它來(lái)幫你看。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

二十分鐘后,AutoGLM 給出了一份總結(jié)報(bào)告。雖然也挺長(zhǎng)的,但已經(jīng)是幾十篇網(wǎng)頁(yè)的濃縮精華版了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

報(bào)告不僅概括了人形機(jī)器人可能在制造業(yè),農(nóng)業(yè)帶來(lái)的生產(chǎn)模式變革,還提供了對(duì)企業(yè)和研究機(jī)構(gòu)的建議。

要是自己看完這幾十篇文章總結(jié)內(nèi)容,二十個(gè)小時(shí)也未必夠。

不知道你行不行,世超覺(jué)得自己不太行。

再測(cè)個(gè)栗子:前幾天 ChatGPT-4o 的文生圖模型一出,有的差友在視頻下留言,原本是做設(shè)計(jì)師的,現(xiàn)在想轉(zhuǎn)水電工了。

那怎么規(guī)劃才能在六個(gè)月之內(nèi)迅速成為一名優(yōu)秀的電工呢?( 手動(dòng)狗頭 )

AutoGLM 先在知乎搜了搜,設(shè)計(jì)師轉(zhuǎn)行做電工的相關(guān)信息。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

別說(shuō),你真別說(shuō),這事看起來(lái)挺可行的,先例還不少。。。

知乎看差不多,再去搜搜小紅書。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

最后生成一份學(xué)習(xí)報(bào)告,詳細(xì)列舉了這六個(gè)月每一階段的計(jì)劃,該學(xué)習(xí)什么課程,具備哪些條件,報(bào)名哪些考試。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

所以各位先別慌,按這個(gè)計(jì)劃來(lái),現(xiàn)在轉(zhuǎn)行還來(lái)得及。

不過(guò)沒(méi)有比較就沒(méi)有傷害。世超又橫向測(cè)試了一下,有些方面 AutoGLM 沉思還是不如一月份 OpenAI 搞出來(lái)的前輩 Operator 。

同樣是搜索食譜,下面來(lái)看看這兩個(gè) agent 的表現(xiàn)有什么區(qū)別吧。

官方演示視頻里可以看到,Operator 很絲滑地完成了奶油蛤蜊意面食譜的搜索。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

打開(kāi)網(wǎng)易新聞 查看精彩圖片

再來(lái)看看 AutoGLM 沉思,提示讓它給出一份糖醋排骨的食譜:

打開(kāi)網(wǎng)易新聞 查看精彩圖片

拋出問(wèn)題,它很快開(kāi)始思考,列出一個(gè) 5 步詳細(xì)計(jì)劃。

需要登錄信息或者有彈窗的時(shí)候,也要人幫幫忙。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在搜索欄輸入關(guān)鍵詞不在話下。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

一開(kāi)始 AutoGLM 沉思的表現(xiàn)還挺靠譜的,順利打開(kāi)網(wǎng)頁(yè)、搜食譜,感覺(jué)一切盡在掌握。直到它打開(kāi)了4 個(gè)小紅書,3 個(gè)b站,2 個(gè)知乎頁(yè)面,事情好像哪里不對(duì)勁了起來(lái)。。。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

收手吧阿祖,是在家做糖醋排骨,不是國(guó)宴。

感覺(jué) AutoGLM 總想做得更好,更全面,它會(huì)一直不停地搜索,更換信源,或者說(shuō)希望找一個(gè) “ 最優(yōu)解 ”,一個(gè) “ 標(biāo)準(zhǔn)答案 ”。

但是在面對(duì) “ 糖醋排骨怎么做 ” 這種根本沒(méi)有標(biāo)準(zhǔn)答案的問(wèn)題時(shí),它會(huì)花費(fèi)大量時(shí)間去檢索,總結(jié)。

其實(shí)答案早就找到了,但它可能是 INTJ 吧,總是不太滿意。

十多分鐘過(guò)去了,糖醋排骨好像怎么做都行,又怎么做都不行。比起 Operator,它太糾結(jié)了。

除了搜食譜,找路好像也不太適合它。。。世超從中關(guān)村出來(lái),剛在頤和園爽玩一圈,還想去北大看看。惦記著剛剛掏著的好東西,就想問(wèn)問(wèn)它從頤和園到北京大學(xué)的公共交通路線。

18 分鐘后,搜索終于結(jié)束了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

最后展示出的結(jié)果中,地鐵,公交,自行車,步行等等情況都被考慮到了,總結(jié)的非常全面到位。

唯一的問(wèn)題是世超已經(jīng)在北京的春風(fēng)里瑟瑟發(fā)抖了很久很久。

當(dāng)然,這一點(diǎn)可能源自它 “ 沉思 ” 的特性,更適合解決復(fù)雜的,需要思考的問(wèn)題。畢竟工具也要分使用場(chǎng)合,不能拿大炮轟蚊子。

不過(guò)在測(cè)試過(guò)程中,世超也確實(shí)遇到了一些其他的細(xì)節(jié)問(wèn)題,會(huì)影響到使用體驗(yàn)。

比如在網(wǎng)頁(yè)搜索結(jié)果給出之后,有時(shí)候會(huì)等待很久,再進(jìn)行點(diǎn)擊。

對(duì)話框顯示它沒(méi)有在思考,但網(wǎng)頁(yè)上也沒(méi)有在操作。作為旁觀者的人類,看著它卡在那里,答案也在那里,卻不能上手替它點(diǎn)擊。

簡(jiǎn)直是新時(shí)代酷刑,焦慮值瞬間拉滿。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

但這畢竟只是個(gè) Beta 測(cè)試版,正式版會(huì)不會(huì)修復(fù)這些問(wèn)題還不好說(shuō)。

綜合來(lái)看,AutoGLM 沉思作為一款免費(fèi)的國(guó)產(chǎn) agent 表現(xiàn)還是不錯(cuò)的,相比起 200 刀一月的 OpenAI Operator 和一碼難求的 Manus,性價(jià)比真心拉滿了,至少能讓大家先無(wú)痛體驗(yàn)一下 AI 幫自己干活是個(gè)啥感覺(jué)。

聽(tīng)說(shuō) 4 月還會(huì)開(kāi)源,到時(shí)候可以再來(lái)圍觀一下還有什么好玩的。

撰文:莫莫莫甜甜

編輯:江江 & 面線

美編:萱萱

圖片、資料來(lái)源:

莫莫實(shí)測(cè)、OpenAI-4o、AutoGLM沉思官網(wǎng)

打開(kāi)網(wǎng)易新聞 查看精彩圖片