打開網(wǎng)易新聞 查看精彩圖片

瀏覽器賽道迅速擠滿了明星創(chuàng)業(yè)公司和大廠巨頭。

作者|張勇毅 Nico
編輯|Nico

The Browser Company 是一家明星且特別的公司。

它創(chuàng)辦于 2019 年,base 在紐約,累計(jì)融資 1.28 億美元,估值超過 5.5 億美元。

核心產(chǎn)品 Arc 瀏覽器,以顛覆性的產(chǎn)品體驗(yàn)吸引了上百萬高粘性用戶,在硅谷極客們眼中,Arc 是過去五年最酷的瀏覽器產(chǎn)品,有著遠(yuǎn)超 Chrome 等傳統(tǒng)瀏覽器的產(chǎn)品設(shè)計(jì)。

但在 2024 年春天完成了 5000 萬美元融資之后,他們悄悄做出了一個(gè)決定——將團(tuán)隊(duì)重心轉(zhuǎn)向新產(chǎn)品「全新設(shè)計(jì)的 AI 瀏覽器」的研發(fā),原產(chǎn)品 Arc 僅保持維護(hù),用戶期待的 Arc 2.0 也許再也不會(huì)有了。

半年后,新產(chǎn)品 Dia 瀏覽器官宣。創(chuàng)始人 Josh Miller 說,他們對(duì)這個(gè) demo 中的新產(chǎn)品,有數(shù)不清的 good idea。

現(xiàn)在, Dia 終于開啟了邀請(qǐng)碼公測。

打開網(wǎng)易新聞 查看精彩圖片

01

為 AI 重新設(shè)計(jì)瀏覽器

這支產(chǎn)品創(chuàng)新能力很強(qiáng)的團(tuán)隊(duì),一開始就目標(biāo)明確:從頭開始,打造一款原生AI瀏覽器

為了做到這一點(diǎn),開發(fā)團(tuán)隊(duì)認(rèn)為必須「推翻重來」;即使他們傾注數(shù)年心血的 Arc 瀏覽器已經(jīng)初步形成規(guī)模效應(yīng)。開發(fā)團(tuán)隊(duì)從未公布過 Arc 瀏覽器的用戶總量,但僅 Windows 版本上線首月就吸引了 20 萬用戶,iOS 端 App Arc Search 上線之后用時(shí)三個(gè)月日活躍用戶數(shù)量就突破了 10 萬。

雖然 Arc 瀏覽器堪稱「古典瀏覽器時(shí)代」的最高潮,但它無力對(duì) AI Agent 對(duì)瀏覽器帶來的這場革命產(chǎn)生關(guān)鍵影響;開發(fā)團(tuán)隊(duì)也曾試圖在 Arc 瀏覽器中整合一部分 AI 功能,但仍然無力改變 Arc 瀏覽器本身并不是為 AI 而生這一事實(shí)。

Dia 官網(wǎng)上的一條信息寫道:Dia 并非僅僅是在現(xiàn)有瀏覽器上添加AI功能,而是將 AI 作為核心構(gòu)建理念,旨在打造一個(gè)全新的、由 AI 驅(qū)動(dòng)的瀏覽環(huán)境。

打開網(wǎng)易新聞 查看精彩圖片

開發(fā)團(tuán)隊(duì)認(rèn)為,AI不應(yīng)該只是一個(gè)應(yīng)用或一個(gè)按鈕,而應(yīng)該成為瀏覽器底層的能力。

Dia 作為從一開始就「深度整合 AI 能力進(jìn)入瀏覽器中」的產(chǎn)品,實(shí)際體驗(yàn)?zāi)軒砟男└淖儯?/p>

02

極簡但優(yōu)雅的產(chǎn)品體驗(yàn)

表面上,Dia 瀏覽器是一款同時(shí)集成了 GPT-4o 與 Gemini Flash 2.0 的多模態(tài) AI 瀏覽器,支持個(gè)性化對(duì)話、視頻分析與多任務(wù)處理,并且免費(fèi)、無使用限制。

但如果你已經(jīng)或曾經(jīng)是 Arc 瀏覽器的用戶,在打開 Dia 的首頁,你就能通過 Dia 首頁,意識(shí)到兩款瀏覽器產(chǎn)品迥然不同的開發(fā)邏輯,即從「復(fù)雜極客工具」到「極簡AI入口」的產(chǎn)品邏輯巨大變化。

打開網(wǎng)易新聞 查看精彩圖片

作為開發(fā)團(tuán)隊(duì)對(duì)「AI 瀏覽器應(yīng)該是什么樣」的一個(gè)實(shí)現(xiàn)方式,Dia 在首頁的一個(gè)角落加入了「Personalize Dia」功能,你可以通過輸入包括「你崇拜誰?」「你喜歡怎樣的學(xué)習(xí)方式?」以及「Dia 的回答風(fēng)格」三個(gè)角度,來幫助 Dia 快速理解用戶本身,將 AI 快速設(shè)定為用戶更熟悉的一個(gè)形態(tài)。

無論是 Steve Jobs 的創(chuàng)新精神,還是《The Atlantic》、《NYT》、《New Yorker》等媒體的視角,用戶的選擇都將潛移默化地影響 Dia 的知識(shí)結(jié)構(gòu)搭建與思考方式,使其在某種程度上成為用戶所崇拜對(duì)象的「投影」。

打開網(wǎng)易新聞 查看精彩圖片

在 AI 融入瀏覽器的浪潮中,Dia 團(tuán)隊(duì)并非簡單地將 AI 生硬地塞入既有的框架,而是試圖從用戶與 AI 的交互入手,構(gòu)想「AI 瀏覽器」的個(gè)性化定制方案。

更進(jìn)一步,Dia 提供了多達(dá) 20 檔的「Dia 的回答風(fēng)格」強(qiáng)度調(diào)節(jié)。這就像早期的操作系統(tǒng)允許用戶調(diào)整字體大小和界面主題一樣,Dia 讓用戶能夠精細(xì)地控制 AI 的表達(dá)方式和情感色彩。默認(rèn)的中間檔位提供了一個(gè)平衡點(diǎn),而用戶可以根據(jù)自己的喜好,微調(diào) Dia 的「個(gè)性」。

簡單設(shè)置好 Dia 的風(fēng)格后,你能感受到開發(fā)團(tuán)隊(duì)在「讓 AI 能說人話」這件事上,一定下足了功夫?!甘娣故亲顪?zhǔn)確的描述。

打開網(wǎng)易新聞 查看精彩圖片

對(duì)于經(jīng)常使用瀏覽器打開眾多窗口、處理復(fù)雜工作的用戶,Dia 瀏覽器的 @Tabs 中包括網(wǎng)頁內(nèi)容分析、自動(dòng)推薦提示詞等功能,確實(shí)能有效幫助用戶理清思路、用最簡單的方式梳理復(fù)雜內(nèi)容的結(jié)構(gòu)脈絡(luò)。

在此前開發(fā)團(tuán)隊(duì)的早期演示中,Dia 還能幫助用戶完成更加復(fù)雜的任務(wù),例如自動(dòng)將郵件中的商品添加到亞馬遜購物車中 —— 彼時(shí) AI Agent 概念還沒有興起。而在現(xiàn)階段版本的體驗(yàn)中 Dia 對(duì)網(wǎng)頁讀取的顆粒度非常細(xì)致,但同時(shí)也更加強(qiáng)調(diào)借助 AI 能力,大幅簡化用戶界面和操作流程,通過設(shè)計(jì)上的「克制」來獲取更加高效的使用體驗(yàn)。

打開網(wǎng)易新聞 查看精彩圖片

Dia 的預(yù)示著未來的 AI 瀏覽器,將不再是冰冷的工具,而是能夠理解用戶、貼近用戶,甚至在某種程度上成為用戶在數(shù)字世界中的延伸。

這與 Manus 團(tuán)隊(duì)為 AI 單獨(dú)打造瀏覽器的思路異曲同工,都指向一個(gè)核心目標(biāo):讓 AI 更好地服務(wù)于人類,同時(shí)以更自然、更個(gè)性化的方式融入我們的數(shù)字生活。

03

與 Manus 不同的產(chǎn)品哲學(xué)

對(duì)于原生 AI 應(yīng)用來講,瀏覽器作為平臺(tái)讓模型能力可以更深入地理解用戶的瀏覽習(xí)慣和上下文,從而提供更個(gè)性化和高效的服務(wù)??焖俚貙?AI Agent 概念中的產(chǎn)品交付給用戶,因此今年的情況,實(shí)際已經(jīng)變成了「優(yōu)秀的 AI 應(yīng)用開發(fā)者,會(huì)打造自己的瀏覽器」。

即使過去三十年互聯(lián)網(wǎng)領(lǐng)域已經(jīng)發(fā)生了數(shù)次重大的技術(shù)變遷,但瀏覽器仍然是構(gòu)成當(dāng)代互聯(lián)網(wǎng)最前沿用戶體驗(yàn)的重要部分。但這也讓瀏覽器市場變得「極端保守」。

或許會(huì)有一些極客用戶,會(huì)為了屏蔽廣告等功能去嘗鮮一款新瀏覽器工具,但絕大部分用戶并不會(huì)為了一點(diǎn)新鮮感,放棄自己原本已經(jīng)熟悉的體驗(yàn) —— 這才是讓 Chrome 過去十余年一家獨(dú)大的根本原因。

如果說 Dia 瀏覽器現(xiàn)階段哪一點(diǎn)最讓人印象深刻,或許仍然是「新鮮感」。但它的新鮮感與充滿「極客工具箱」屬性的 Arc 又有著明顯不同,Dia 瀏覽器更像是開發(fā)團(tuán)隊(duì)打造的一片「適合 AI 應(yīng)用生長的土壤」。

這個(gè)思路與此前打造出 Manus AI 的 Monica.im 團(tuán)隊(duì)異曲同工:在開發(fā) Manus 的過程中,Monica.im 曾經(jīng)一度想打造一款 AI 瀏覽器,但他們很快遇到了一個(gè)問題:AI 和人類共用一個(gè)瀏覽器界面,體驗(yàn)極差。

最終 Monica.im 的解決方案是:為 AI 單獨(dú)打造一款瀏覽器,讓人與 AI 交互,AI 操作瀏覽器完成執(zhí)行命令。作為基于瀏覽器的 Agent 而存在,它需要用戶在「想用 AI」 的時(shí)候使用。

針對(duì)同一個(gè)問題,在瀏覽器交互上有著極強(qiáng)創(chuàng)新能力的 Dia 團(tuán)隊(duì),給出的答案是:在 AI 能夠更好地融入瀏覽器之后,重新設(shè)計(jì)瀏覽器的交互邏輯。

雖然 The Browser Company 聲稱自己「不做 App」,但瀏覽器本質(zhì)上仍然是一個(gè)巨型 App。除了 Dia 這樣的挑戰(zhàn)者,包括谷歌、Opera 等在上一個(gè)時(shí)代掌握瀏覽器入口的選手,也在主動(dòng)擁抱 AI Agent 給瀏覽器帶來的轉(zhuǎn)型機(jī)會(huì)。

打開網(wǎng)易新聞 查看精彩圖片

在當(dāng)前 AI 應(yīng)用發(fā)展處于早期,并未提供手機(jī)系統(tǒng)級(jí)別的生態(tài)入場機(jī)會(huì)的前提下,無論是 The Browser Company 還是 Perplexity 的 Comet,都選擇了瀏覽器作為布局 LLM 深度交互生態(tài)的「船票」。

由于瀏覽器這個(gè)形態(tài)的產(chǎn)品自承接端側(cè)用戶信息以及互聯(lián)網(wǎng)入口的屬性,因此一些硬件/手機(jī) OS 廠商,都又在這個(gè)領(lǐng)域嘗試突破,落地一部分 AI Agent 的能力,因此這個(gè)賽道會(huì)迅速變得「百花齊放」,也會(huì)是 AI Agent 短期內(nèi)最讓人興奮的突破口之一。

打開網(wǎng)易新聞 查看精彩圖片

問題實(shí)際上變成了:對(duì)于創(chuàng)業(yè)公司來講,AI 瀏覽器是否已經(jīng)是現(xiàn)有生態(tài)下的 AI App 終點(diǎn)?

04

創(chuàng)業(yè)公司和大廠都在做瀏覽器

回到一個(gè)根源的問題,「瀏覽器」是什么?

它是互聯(lián)網(wǎng)歷史的第一個(gè)「入口」。PC 互聯(lián)網(wǎng)的最初期,以網(wǎng)景、Mosaic 為代表的圖形界面瀏覽器改變了用戶訪問互聯(lián)網(wǎng)的方式,微軟 IE 瀏覽器更是因?yàn)榉磯艛喟父淖兞丝萍几偁幐窬帧?/p>

隨后,Office、Adobe 等桌面軟件一度興起,占據(jù)大量市場份額,但 Web 端依然出現(xiàn)了 G-Suite 和 Canva、Figma、Notion 等新銳產(chǎn)品,隨著 SaaS 模式在全球市場的成功,最終網(wǎng)頁應(yīng)用和移動(dòng) App 成為了開發(fā)者 top 2 的選擇。

至少在桌面平臺(tái)上,瀏覽器是聚攏價(jià)值的金山。用戶瀏覽信息(新聞、博客、流媒體),執(zhí)行操作(郵件、創(chuàng)作、視頻會(huì)議),所有這些,在大模型時(shí)代,我們稱之為 context(上下文)。

這意味著,AI 有極大的發(fā)揮空間,以及被 augmented 的機(jī)會(huì)。

如果你關(guān)注過去數(shù)月關(guān)于 Agentic AI 的討論,你會(huì)發(fā)現(xiàn) browser 瀏覽器作為產(chǎn)品形態(tài),頻繁地被討論和使用。

Manus 內(nèi)置了瀏覽器,Opera 發(fā)布 AI 助手 Aria,Perplexity 和 OpenAI 都在做瀏覽器產(chǎn)品,當(dāng)然還有 The Browser Company 的新產(chǎn)品 Dia。

一些原本定義并非瀏覽器的產(chǎn)品,也選擇了瀏覽器的形態(tài)。比如豆包,它的桌面端基于 Chromium 開發(fā)。另一家大廠也有類似形態(tài)的產(chǎn)品——夸克的桌面端。這兩家大廠的產(chǎn)品,功能極其全面,且用戶量遠(yuǎn)遠(yuǎn)領(lǐng)先創(chuàng)業(yè)團(tuán)隊(duì)的新產(chǎn)品,最重要的,它們都是各自集團(tuán) AI to C 的重點(diǎn)發(fā)力產(chǎn)品。

打開網(wǎng)易新聞 查看精彩圖片

豆包希望成為你的默認(rèn)瀏覽器

還有 Claude 的桌面端應(yīng)用,基于 Electron 框架的 PWA 應(yīng)用——還是 Chromium。(當(dāng)然 Claude 大概率是個(gè)暫時(shí)性的產(chǎn)品,他們應(yīng)該沒準(zhǔn)備一輩子用這個(gè)形態(tài)。)

打開網(wǎng)易新聞 查看精彩圖片

部分 AI 瀏覽器或基于瀏覽器的 AI 產(chǎn)品

還有很多廠商在琢磨怎么讓 AI 能夠更好地「使用瀏覽器」,比如剛剛完成融資的 browser-use,以及 Amazon 剛剛發(fā)布的 Nova Act SDK,這些項(xiàng)目更多在框架層,為開發(fā)者提供調(diào)取瀏覽器的服務(wù)。

從 AI 接入方式的層面上,AI 瀏覽器產(chǎn)品大多可以分為三類:

  1. 傳統(tǒng)瀏覽器 + AI,通常以 copilot 的形式存在,最早有 Mircosoft Edge,以及 Chrome 上包括 Monica.im 在內(nèi)的各種瀏覽器插件。

  2. 讓 AI built-in 瀏覽器的更底層,有更多權(quán)限。比如 Arc Max 能夠整理 tab,Opera Aria 能夠像 Manus 一樣執(zhí)行操作,Dia 未來能夠擁有記憶,知道用戶拿瀏覽器做過什么。豆包和夸克的桌面端產(chǎn)品,看起來「上網(wǎng)」不再是最核心的 feature——就像打電話之于智能手機(jī)。OpenAI 和 Perplexity 正在研發(fā)的產(chǎn)品,大概率也在這個(gè)范疇內(nèi)。

  3. 打造一款給 AI 用的瀏覽器。這是 Manus 主要的產(chǎn)品哲學(xué),他們讓用戶與 AI 交互,AI 去操作跑在虛擬機(jī)上的瀏覽器,是個(gè)更加終局的解決方案。

功能性的 roadmap 是明確且共識(shí)的:

最開始,AI 處理一個(gè)信息單元,讀取單個(gè)網(wǎng)頁,閱讀文字,抽取 YouTube 字幕,或者理解用戶當(dāng)前所處的網(wǎng)頁環(huán)境;

然后,context 延展,AI 能夠理解更多的信息,比如其他已經(jīng)打開的 Tab,甚至能夠記住用戶過去打開的網(wǎng)頁、執(zhí)行的操作;

最終,AI 必然會(huì)代替用戶執(zhí)行操作,比如挑選商品、發(fā)送郵件、寫文檔、做設(shè)計(jì),所有用戶在瀏覽器內(nèi)能做的事,AI 都可以執(zhí)行。

這是一個(gè)非常清晰的,能夠顛覆過去瀏覽器體驗(yàn)的機(jī)會(huì)。

只是我們還不知道,這個(gè)機(jī)會(huì)屬于拿到 5000 萬美元融資的 The Browser Company,還是傳統(tǒng)巨頭 Chrome 和 Edge,又或者,下一個(gè)像 Manus 一樣的創(chuàng)業(yè)新秀會(huì)橫空出世,將想象中的用戶體驗(yàn)變成現(xiàn)實(shí)。

你對(duì) AI 瀏覽器有什么不一樣的理解?你覺得瀏覽器領(lǐng)域還存在創(chuàng)業(yè)者的機(jī)會(huì)嗎?極客公園和 Founder Park 正在針對(duì) Agentic AI 進(jìn)行系列研究,歡迎掃描下方作者名片的二維碼,加好友與我們交流。

*頭圖來源:Dia

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

極客一問

你如何看待 Dia 瀏覽器?

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

播客上新

文章沒看夠,想了解更多文章寫作和熱點(diǎn)事件幕后?想跟離普編輯部小伙伴近距離互動(dòng)?

速來關(guān)注由極客公園全新打造的科技行業(yè)漫談播客「逐漸離普」!我們將回顧當(dāng)周最熱的科技事件,為你蒸餾認(rèn)知、聊透行業(yè)真相。歡迎大家踴躍報(bào)題、積極吐槽,一同加入漫談日常!節(jié)目指路

打開網(wǎng)易新聞 查看精彩圖片