
一次自我革命的轉(zhuǎn)型,能成嗎?
前百度集團(tuán)副總裁、小度科技CEO景鯤離職創(chuàng)業(yè)的GenSpark,最近從AI搜索向AI Agent轉(zhuǎn)型,看來是想脫離AI搜索的競爭紅海,向更智能的Agents服務(wù)領(lǐng)域進(jìn)發(fā),推特上很多網(wǎng)友評(píng)價(jià),此次新產(chǎn)品比較有看點(diǎn)。
他們宣稱Genspark Super Agent是一個(gè)綜合性的AI助手(AI Search+Browse+Agents ),可以協(xié)調(diào)多個(gè)AI工具高效地執(zhí)行各項(xiàng)任務(wù)。鯨哥測(cè)試下來,GenSpark在AI搜索、Agent、Deepsearch幾方面,都做了比較好的融合。
有多厲害呢, 在“GAIA Benchmark”(通用人工智能基準(zhǔn)測(cè)試 )圖表中,Genspark在三個(gè)不同級(jí)別(Level 1、Level 2、Level 3 )測(cè)試中的表現(xiàn),都超越了Manus、OpenAI Deep Research 等產(chǎn)品。

但對(duì)于剛剛正式海外上線的Manus而言,GenSpark顯然并沒有瞄準(zhǔn)它作為競爭對(duì)手,而是選擇Perplexity、秘塔AI以及過去的自己,顛覆AI搜索顯然是個(gè)更大的市場(chǎng)。
如今的AI搜索有幾個(gè)痛點(diǎn):
問題思考的時(shí)長,回答的長短不好控制,受限于模型能力,回答效果也不一定。這點(diǎn)很影響用戶體驗(yàn),等了半天回答的不盡如人意,那用戶可能用一次就走。
沒有多維信息處理,也沒有Agent能力,這意味著想法到工具服務(wù)的路徑?jīng)]法打通。這個(gè)是百度多少年的夢(mèng)想,搜索始終局限在文字信息中心。
沒有Deep Research能力,很多深度思考的問題,只是調(diào)用AI回答了,不夠深入。
Manus一定程度上,解決了2、3問題。但是也付出了代價(jià),就是程序比較重,內(nèi)置虛擬機(jī)操作瀏覽器,結(jié)合AI大模型深度處理問題,結(jié)果在VSC中查看,給出的效果確實(shí)不錯(cuò)。
也造成大家日常問題不能麻煩Manus,畢竟沒有網(wǎng)頁服務(wù)可隨時(shí)用,只能下載端側(cè)應(yīng)用,而且一思考就20分鐘,還十分消耗Tokens,費(fèi)時(shí)費(fèi)錢。更具難度的問題,還是ChatGPT的DeepResearch更靠譜。
GenSpark使用門檻比較低,但是每次使用感覺都有驚喜。
這源于它的解決思路,是在日常和中等任務(wù)這段區(qū)域,快速且高效回答問題,并且完成度不錯(cuò)。
在官網(wǎng)上,GenSpark給出了典型問題『去哪旅游』的回答Case。
可以看到GenSpark搜集了衣食住行的各項(xiàng)問題,比較驚喜的是,它還搜索了圖片等多維信息,調(diào)用了地圖等工具。

而且還在最后,給出了餐廳等預(yù)訂鏈接,你可以直接點(diǎn)擊打電話預(yù)訂。
GenSpark還有個(gè)打電話功能,和豆包通話是AI對(duì)話能力不同,你對(duì)他說“預(yù)訂明天晚上7點(diǎn)在西餐廳的兩人座位”,Genspark 就會(huì)撥打電話并完成預(yù)訂。

這個(gè)功能比較西方化,國內(nèi)好多人用APP習(xí)慣了,電話都不怎么打了,我們是大眾點(diǎn)評(píng)團(tuán)購是主要服務(wù)場(chǎng)景。
相比智譜等AutoGLM等直接實(shí)現(xiàn)了點(diǎn)咖啡,GenSpark確實(shí)還沒Agent到這一地步。但從使用效果而言,一句話直接買咖啡場(chǎng)景,適合的環(huán)境需要非常理想的環(huán)境,以及你要全部授權(quán)調(diào)用能力給AI。
簡單說發(fā)布會(huì)看看就得了,實(shí)際操作很難落地。
而GenSpark選擇調(diào)用Agent但是不全部執(zhí)行的策略,查看了很多網(wǎng)頁以及工具,涉及到購買等步驟就停止了,最后一公里不只是技術(shù)問題,還是隱私保護(hù)等問題。當(dāng)下階段不去觸碰,還是挺明智。
官方給出的案例很多有濾鏡,以下是我測(cè)試的第一個(gè)問題,也是我近期在思考的AI兼職創(chuàng)業(yè)問題,大家可以看看效果幾何。
設(shè)計(jì)下如何利用Gen-4、GPT-4o、Trae等最新工具,做AI短劇、AI表情包、AI海報(bào)以及AI PPT(AI Coding 生成SVGPPT)爆款出圈。 然后分析哪個(gè)技術(shù)實(shí)現(xiàn)了行業(yè)轉(zhuǎn)折點(diǎn)能力的突破,構(gòu)建月入百萬的實(shí)現(xiàn)路徑,分析下哪個(gè)路徑好!
GenSpark深度分析了幾個(gè)領(lǐng)域目前的進(jìn)展,捋順了行業(yè)從生產(chǎn)到售賣的過程,并提出了優(yōu)劣分析。以下是其中AI短劇一個(gè)領(lǐng)域的分析截圖,制作流程的分解,收益模式的分析,盈利數(shù)據(jù)的預(yù)測(cè)等等,挺面面俱到分析。

最優(yōu)秀的是,他直接生成了比較精美的PPT。而且這個(gè)PPT不是套模板,很多分布圖和邏輯圖,都是按照生成的內(nèi)容配比。

一份相當(dāng)具有可用性的分析報(bào)告,一度讓我十分驚艷。
當(dāng)然,相比Deep Research來說,他的思考水平還是有一點(diǎn)差距,我調(diào)用O3-mini-high模型的Deep Research同樣做了這份分析報(bào)告。

Deep Research沒有生成更容易瀏覽的PPT,但是內(nèi)容更深刻點(diǎn),每個(gè)項(xiàng)目需要的工具,以及啟動(dòng)成本,還有潛在收益估算,都有貼近實(shí)際的分析和呈現(xiàn)。(報(bào)告鏈接:https://chatgpt.com/share/67ee1d0c-d7f8-8005-af20-4cff30eb6fbe)
在第二個(gè)測(cè)試中,我測(cè)試了電商購買場(chǎng)景中的思考問題:
幫我比較電商渠道的兩款產(chǎn)品:
我在考慮購買 和 <華為鴻蒙最新款> 。 需求:- 我經(jīng)常出差,需要 <影視剪輯> 、 <續(xù)航長> 的筆記本,也關(guān)注 <不要太重> 。 請(qǐng)從性價(jià)比、生態(tài)產(chǎn)品服務(wù)、用戶評(píng)價(jià)等方面比較A和B,列出各自的優(yōu)缺點(diǎn),并根據(jù)我的需求給出推薦國內(nèi)外等電商渠道的購買鏈接。

從生成的報(bào)告看,并僅用了三四十秒鐘就完成了。而且查看了電商品臺(tái)的網(wǎng)頁,給出了購買鏈接,將一些國補(bǔ)等優(yōu)惠信息也分析了出來。這就有點(diǎn)實(shí)用了。

實(shí)現(xiàn)以上能力,他們提到了GenSpark產(chǎn)品背后的幾項(xiàng)技術(shù)突破。
1、世界上第一個(gè)混合代理系統(tǒng),利用最佳模型、工具和數(shù)據(jù)集來完成不同的任務(wù)
它的LLM可以使用 o 1、o3-mini-high、Claude 3. 7。圖像生成可以使用 FLUX、ogram、Recraft,視頻可以用 Kling 和 Luma。
不知GenSpark是不是利用CoE(Collaboration-of-Experts,專家協(xié)同)架構(gòu),實(shí)現(xiàn)了思維鏈+多系統(tǒng)協(xié)同,每個(gè)問題能找最適合的大模型回答。這個(gè)GenSpark不算是第一個(gè)實(shí)現(xiàn)。
2、內(nèi)部構(gòu)建的各種可靠的工具集,經(jīng)過精心構(gòu)建和測(cè)試,以確保效率和穩(wěn)健性
調(diào)用工具集是否順暢,Google genmini有先天優(yōu)勢(shì),它在移動(dòng)互聯(lián)網(wǎng)時(shí)代做了比較多的工具。
現(xiàn)在AI時(shí)代,預(yù)計(jì)MCP協(xié)議有助于讓大模型調(diào)用工具更順暢。這點(diǎn)短期有差距,長期大家應(yīng)該都能順暢使用很多工具。
3、內(nèi)部構(gòu)建的各種可靠數(shù)據(jù)集,預(yù)先構(gòu)建并從網(wǎng)絡(luò)上提取,以確保質(zhì)量、新鮮度和數(shù)量。
估計(jì)這是Genspark對(duì)傳統(tǒng)搜索更理解的優(yōu)勢(shì)所在,自己從頭清洗數(shù)據(jù)。從生成的內(nèi)容看,鯨哥認(rèn)為比目前的AI搜索效果更好一些。
當(dāng)然,也不是說Genspark沒有劣勢(shì)。目前來說Genspark也是套殼應(yīng)用,它卡在AI搜索和純粹Agent應(yīng)用兩種形態(tài)中間,大家是否會(huì)習(xí)慣這種AI形態(tài),就比較難說。
而且在AI搜索市場(chǎng)并未建立起優(yōu)勢(shì),就徹底轉(zhuǎn)變?yōu)锳gent形態(tài),還好是大廠高管背景出身,剛剛?cè)谫Y了1億美金,作為初創(chuàng)企業(yè)有一定的容錯(cuò)率。

Dia看起來極簡,實(shí)際也是在走夸克的『超級(jí)搜索框』思路,AI對(duì)搜索的內(nèi)容分析精細(xì)度和徹底融入了Agent能力方面,都號(hào)稱更強(qiáng)。
相比Dia,Genspark沒這么AI Native,它更像是Chatbot形態(tài)的AI瀏覽器。比Dia更易用,未來潛力也許比不過。
從使用成本來看,Genspark也只是比Manus略低,每個(gè)月24.99美元。當(dāng)下階段,對(duì)內(nèi)容有深入要求的用戶,可能付費(fèi)ChatGPT的DeepResearch更有效果。
當(dāng)然,Genspark還有AI圖片、AI視頻等功能,公告說正在自己訓(xùn)練模型。這樣看每個(gè)月25美金還值得。
目前,Genspark也支持制作解釋烹飪食譜的視頻或根據(jù)新聞主題制作簡短的動(dòng)畫視頻。AI會(huì)自動(dòng)處理從腳本創(chuàng)建、視頻生成到語音合成的所有事情。

鯨哥看效果并不出眾,這些流程沒必要Agent化。視頻肯定是效果有限,不是效率優(yōu)先。
客觀說,Genspark這次轉(zhuǎn)型還比較有眼光,如果沿著AI搜索的路徑走,大概率下輪融資也比較難,且不說ChatGPT和Perplexity這些巨頭對(duì)其威脅,Google這些掌握搜索數(shù)據(jù)的企業(yè),還有底層模型的優(yōu)勢(shì),未來等AI搜索的產(chǎn)品形態(tài)穩(wěn)定,想超越也是分分鐘的事情。
Genspark向著更Agent能力發(fā)展,就走出了差異化競爭路線,有助于培養(yǎng)用戶的新AI使用習(xí)慣,提升付費(fèi)率。
作為初創(chuàng)企業(yè),也許給自己找到了短期活下去的出路。長期競爭還是很難,Agent瀏覽器預(yù)計(jì)是2025年最受關(guān)注的AI應(yīng)用賽道,大廠預(yù)計(jì)都會(huì)下場(chǎng)競爭。
視頻內(nèi)容推薦:
主理人交流:
加入AI鯨英社群,和上千CEO、投資人和行業(yè)大牛一起共話未來!

這些職業(yè)正在被摧毀:實(shí)測(cè)10個(gè)GPT-4o繪圖最火的案例

OpenAI和Google同日地震級(jí)更新:人間一夜,AGI 臨近!
熱門跟貼