打開網(wǎng)易新聞 查看精彩圖片

美國(guó)科幻大片《鋼鐵俠》中,無所不在的人工智能管家賈維斯,不僅會(huì)獨(dú)立思考,還能自由操控鋼鐵俠的35臺(tái)機(jī)甲,隨叫隨到幫鋼鐵俠處理很多事。

電影里的賈維斯,如今正迅速走進(jìn)現(xiàn)實(shí)。

只要對(duì)著你的電腦說:請(qǐng)幫我到BOSS直聘篩選兩個(gè)見習(xí)前端工程師,在泡咖啡的工夫,電腦屏幕上鼠標(biāo)已經(jīng)自己忙乎起來:自動(dòng)識(shí)別并登錄BOSS直聘、識(shí)別簡(jiǎn)歷、調(diào)用大模型分析是否匹配,自動(dòng)向求職者打招呼……咖啡還沒喝完,你的“AI打工人”已經(jīng)幫你完成了所有工作。

前些天,在英偉達(dá)GTC 2025大會(huì)上,英偉達(dá)CEO黃仁勛就表示,我們已經(jīng)進(jìn)入了代理式AI(Agentic AI)時(shí)代。代理式AI將能夠自主決策和行動(dòng),為人類社會(huì)帶來更加深遠(yuǎn)的影響。

恰好在半個(gè)多月前,一款名為Manus的AI Agent(智能體)火爆出圈。全網(wǎng)求邀請(qǐng)碼的那天,孫林君的電話被打爆了。同事們開玩笑說他給Manus當(dāng)了一天的“客服”。電話那頭有客戶、投資人以及媒體,大家問得最多的一句話是:你們公司換馬甲了?

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

實(shí)在人創(chuàng)辦“實(shí)在智能”

盡管Manus富有爭(zhēng)議,但它的出現(xiàn)確實(shí)讓大眾燃起了對(duì)AI Agent的興趣,見識(shí)到了如果AI持續(xù)進(jìn)步,能夠在一定程度上接管生活和工作,成為得力幫手。

而在這件事上,孫林君已經(jīng)做了很多工作。7年前,他提交了離職申請(qǐng),結(jié)束了在阿里10年算法工程師的身份,創(chuàng)辦了“實(shí)在智能”,投身人工智能的星辰大海。短短幾年時(shí)間將實(shí)在智能做成了國(guó)內(nèi)頭部的機(jī)器人流程自動(dòng)化服務(wù)商。

最近,實(shí)在智能也發(fā)布了一款A(yù)gent,只要一個(gè)簡(jiǎn)單指令,就能幫你操作電腦里的一切軟件,輕松搞定工作。在Manus出圈前,實(shí)在智能的Agent數(shù)字員工就已經(jīng)在上千家公司悄悄上崗。

孫林君本科和研究生讀的都是數(shù)學(xué)系人工神經(jīng)網(wǎng)絡(luò)計(jì)算專業(yè),大學(xué)畢業(yè)后先后入職摩托羅拉和阿里巴巴,成為一名資深算法工程師。

打開網(wǎng)易新聞 查看精彩圖片

剛大學(xué)畢業(yè)的孫林君

在阿里的10年,孫林君經(jīng)歷了機(jī)器學(xué)習(xí)大數(shù)據(jù)、深度學(xué)習(xí)到各種人工智能產(chǎn)品的研發(fā)。他曾牽頭打造了阿里巴巴誠(chéng)信模型體系,現(xiàn)在很多人每天都使用的花唄、借唄、小微銀行等,都建立在這一誠(chéng)信體系之上。

2017年和2018年,隨著柯潔在烏鎮(zhèn)輸給AlphaGo,Transformer框架和谷歌深度學(xué)習(xí)的自然語言處理(NLP)模型BERT的出現(xiàn),新一波人工智能的浪潮掀起了漣漪。

2017年的一天,孫林君拉上在摩托羅拉的前同事張俊九,以及張俊九的研究生同學(xué)高揚(yáng)在西湖邊喝茶聊天。聊到當(dāng)時(shí)的創(chuàng)業(yè)熱潮,三個(gè)男人開始不約而同地吐槽起很多創(chuàng)業(yè)故事不靠譜。聊著聊著,三人開玩笑說,如果將來要?jiǎng)?chuàng)業(yè),就做一家實(shí)在的公司。

打開網(wǎng)易新聞 查看精彩圖片

實(shí)在智能三位創(chuàng)始人

從左往右分別是高揚(yáng)、孫林君和張俊九

茶喝完,三個(gè)人拉了個(gè)小群,名字就叫“實(shí)在智能”。

第二年,這三個(gè)人和幾個(gè)合伙人的草臺(tái)班子集結(jié)完畢。為了節(jié)省開支,他們把公司設(shè)在杭州西溪濕地附近一家公司的閑置辦公區(qū),剛開始的辦公桌還是找朋友借的。

打開網(wǎng)易新聞 查看精彩圖片

如今位于南湖未來科學(xué)園的實(shí)在智能

打開網(wǎng)易新聞 查看精彩圖片

拿著錘子找釘子

實(shí)在智能核心團(tuán)隊(duì)約半數(shù)成員來自阿里巴巴,以及百度、騰訊、美團(tuán)點(diǎn)評(píng)、網(wǎng)易、搜狐等一線互聯(lián)網(wǎng)企業(yè)。短短不到一年,從幾人的草臺(tái)班子一下子增加到了60多人的團(tuán)隊(duì),從借桌子辦公到開始擁有寬敞的辦公場(chǎng)地。

和大多數(shù)初創(chuàng)公司一樣,孫林君也經(jīng)歷了拿著錘子找釘子的過程。

剛開始做了一個(gè)叫“包小黑”的AI法律產(chǎn)品,主要解決原告和被告之間的法律問題。名字一看就是來自斷案如神的包公。

打開網(wǎng)易新聞 查看精彩圖片

2018年10月11日,慶?!鞍『?.0.1”版本上線

一旦發(fā)生糾紛,這件事值不值得打官司?能不能打贏?以前需要咨詢律師,不僅耗費(fèi)時(shí)間,收費(fèi)也很貴。孫林君看中了這個(gè)痛點(diǎn),“包小黑”可以在幾秒之內(nèi)生成一份評(píng)估報(bào)告。

雖然產(chǎn)品市場(chǎng)反響很好,但問題很快來了,使用場(chǎng)景很低頻,客單價(jià)也不高,意味著很難商業(yè)化和變現(xiàn)。

有一次在幫客戶處理法律糾紛問題時(shí),需要對(duì)方提供數(shù)據(jù)再建模。但對(duì)方提供不了接口,孫林君只好找一家供應(yīng)商開發(fā)接口,結(jié)果供應(yīng)商報(bào)了大幾十萬的預(yù)算。

孫林君覺得這件事不劃算,但算法工程師出身的他立馬聯(lián)想到,只要用自動(dòng)化腳本,就能把原來的數(shù)據(jù)提取出來。

其實(shí)這個(gè)過程就是最簡(jiǎn)單的RPA(機(jī)器人流程自動(dòng)化)。

提到RPA,許多人可能比較陌生。通俗說來,它就是讓機(jī)器模擬人類操作電腦,實(shí)現(xiàn)重復(fù)性、規(guī)則明確的業(yè)務(wù)流程自動(dòng)化的技術(shù)?。

RPA的雛形可以追溯至20世紀(jì)的“屏幕抓取”,但受限于規(guī)則引擎的僵化性,當(dāng)時(shí)只能處理簡(jiǎn)單重復(fù)任務(wù)。直到2016年后,RPA開始集成OCR、NLP等AI技術(shù),才開始突破傳統(tǒng)規(guī)則的限制。

“還不如做這個(gè),我們能把它做得更智能?!边@個(gè)新“釘子”讓孫林君興奮地?fù)]舞起了錘子。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

給機(jī)器裝上大腦、眼睛和手腳

創(chuàng)業(yè)過程中,孫林君接到西湖大學(xué)AI科學(xué)家藍(lán)振忠博士的電話,對(duì)方提到了一家名叫Adept AI Labs的公司。

這是一家位于舊金山、專注于開發(fā)通用人工智能(AGI)助手的初創(chuàng)公司,核心成員之一,就是當(dāng)年發(fā)布Transformer框架論文的作者——前谷歌大腦研究員Ashish Vaswani。

當(dāng)時(shí)成立僅一年時(shí)間,Adept AI Labs估值便突破10億美元,成為AI Agent獨(dú)角獸公司。這家公司的使命是:創(chuàng)建能夠像人類一樣使用各種電腦軟件完成工作的AI智能體。

這個(gè)愿景和實(shí)在智能不謀而合。只不過兩家公司走了不同的技術(shù)路線。Adept AI Labs是在瀏覽器上裝一個(gè)插件,所以只能操作基于瀏覽器的軟件。實(shí)在智能的Agent可以兼容和操作一切瀏覽器和服務(wù)器、客戶端。

剛開始,RPA數(shù)字員工最常用的場(chǎng)景是財(cái)務(wù)對(duì)賬、訂單處理、數(shù)據(jù)批量導(dǎo)入導(dǎo)出等。孫林君發(fā)現(xiàn)其中有一定的局限性。

打開網(wǎng)易新聞 查看精彩圖片

比如財(cái)務(wù)最常見的一個(gè)場(chǎng)景應(yīng)用,企業(yè)下載資金流水,需要先登錄到銀行,選中對(duì)應(yīng)日期,查詢?cè)龠M(jìn)行下載。通過RPA,這套工作可以用機(jī)器人自動(dòng)完成,但背后需要軟件工程師先將這一套流程的代碼打出來,或者企業(yè)內(nèi)部用拖拉拽的方式在獨(dú)立的機(jī)器人上才能夠完成。

換句話說,傳統(tǒng)的RPA還是依賴于程序員或者懂程序的人。“對(duì)財(cái)務(wù)、HR這些非技術(shù)崗位來說,門檻太高了,把小白逼成了程序員?!睂O林君說。

為了讓小白也能迅速上手,2019年開始,孫林君和團(tuán)隊(duì)開始嘗試RPA+AI融合的方式,即IPA(智能流程自動(dòng)化)來突破局限性。

當(dāng)時(shí),大模型還不成熟,孫林君提了一個(gè)大膽但很確信的夢(mèng)想:為全世界貢獻(xiàn)100萬個(gè)數(shù)字員工。

為此,他們徹底重構(gòu)了RPA的底層架構(gòu)。2022年底,ChatGPT大語言模型剛剛橫空出世,有著很強(qiáng)AI背景的實(shí)在智能團(tuán)隊(duì)迅速推出了智能屏幕語義理解技術(shù)ISSUT以及自研垂直“塔斯(TARS)大語言模型”。

簡(jiǎn)單來說,TARS大模型就相當(dāng)于“大腦”,ISSUT相當(dāng)于“眼睛”,IPA則是“手和腳”。也就是說給大腦安裝上了眼睛、手和腳。

“智能體有很強(qiáng)的思維能力和理解能力,在這個(gè)基礎(chǔ)上給它加上手和腳,相當(dāng)于加上了行動(dòng)能力,使得它不僅能思考,并且能夠行動(dòng)?!苯?jīng)過這么一調(diào)整,整合了計(jì)算機(jī)視覺和底層框架之后,實(shí)在智能Agent更像一個(gè)“人”了。

打開網(wǎng)易新聞 查看精彩圖片

一群激情的人

一起做一件激情的事

擁有一個(gè)實(shí)在Agent或者說是數(shù)字員工,它能幫你做什么?

在最近的一場(chǎng)發(fā)布會(huì)上,實(shí)在智能合伙人兼核心算法部負(fù)責(zé)人歐陽小剛揭示了實(shí)在Agent的三大核心技術(shù)體系:人級(jí)推理能力、無限鏈接能力、場(chǎng)景適應(yīng)能力。

假如你是一位HR,想招聘員工,你只要告訴它:請(qǐng)幫我到BOSS直聘篩選兩個(gè)見習(xí)前端工程師。

電腦里的Agent就會(huì)自動(dòng)登錄BOSS的職位管理頁面,自動(dòng)識(shí)別你要招聘的崗位的要求及篩選條件。在牛人頁面里,它會(huì)挨個(gè)順序點(diǎn)開,一一查看牛人的簡(jiǎn)歷,然后調(diào)用大模型分析是否符合你的要求,如果符合,它會(huì)自動(dòng)向牛人打招呼。以此類推,最終執(zhí)行完成后,再告訴你執(zhí)行的結(jié)果。整個(gè)過程不需要人工參與。

 Manus火爆全網(wǎng)那天,杭州這家公司的電話被打爆了
打開網(wǎng)易新聞 查看更多視頻
Manus火爆全網(wǎng)那天,杭州這家公司的電話被打爆了

實(shí)在Agent正在招聘員工,它像人一樣看見屏幕、操作鼠標(biāo)和控制電腦

假如你是一名汽車記者,想快速創(chuàng)作一則汽車新聞,可以對(duì)它說:幫我寫最新的汽車新聞。Agent就會(huì)去你指定的源頭找到熱門汽車新聞,然后根據(jù)你的需求進(jìn)行仿寫。

如果覺得文字稿不夠,你也讓它幫你快速剪輯一條視頻。它會(huì)自動(dòng)連上剪映App,一鍵成片。再也不怕軟件之間不兼容,Agent可以操控你電腦里的所有軟件。

如果你是一名財(cái)務(wù),想將兩個(gè)封閉系統(tǒng)的表格合成一張,你可以這樣告訴他:請(qǐng)幫我把“有用”財(cái)務(wù)軟件內(nèi)的財(cái)務(wù)數(shù)據(jù)和CRM中的財(cái)務(wù)報(bào)銷報(bào)表進(jìn)行合并。它就能分別下載相應(yīng)表格,統(tǒng)計(jì)合成一張。

當(dāng)然,你也可以用一句話讓它買咖啡、訂機(jī)票、制定旅游計(jì)劃,做市場(chǎng)調(diào)研出分析報(bào)告。

 Manus火爆全網(wǎng)那天,杭州這家公司的電話被打爆了
打開網(wǎng)易新聞 查看更多視頻
Manus火爆全網(wǎng)那天,杭州這家公司的電話被打爆了

實(shí)在Agent幫品牌分析競(jìng)品數(shù)據(jù)并出報(bào)告的過程

和很多80后一樣,孫林君是看著熱血?jiǎng)勇L(zhǎng)大的。 從讀書的時(shí)候開始追動(dòng)漫,一直追到了工作以后。 現(xiàn)在只要有時(shí)間,偶爾還會(huì)刷兩集過過癮。 在創(chuàng)辦實(shí)在智能以后,他把熱血?jiǎng)勇幕瘞нM(jìn)了公司。

孫林君把公司文化定義為“一群激情的人一起做一件激情的事”。

打開網(wǎng)易新聞 查看精彩圖片

公司每年舉辦的“實(shí)在動(dòng)漫花名節(jié)”

每個(gè)人都可以cosplay自己喜歡的動(dòng)漫人物

在位于南湖未來科學(xué)園的實(shí)在智能,處處是動(dòng)漫元素。除了各種手辦,各個(gè)會(huì)議室用動(dòng)漫命名。每個(gè)員工不管年齡大小,都有一個(gè)動(dòng)漫角色的花名。比如孫林君的花名是《功夫熊貓》里的阿寶,也就是“神龍大俠”功夫熊貓本尊,合伙人兼核心算法部負(fù)責(zé)人歐陽小剛的花名是《名偵探柯南》里的“新一”。

目前,實(shí)在智能有員工300多人,研發(fā)人員占比達(dá)54%。在實(shí)在智能辦公室,陳列著掛著80多項(xiàng)已授權(quán)發(fā)明專利,以及300多項(xiàng)知識(shí)產(chǎn)權(quán)。從初創(chuàng)公司到成為國(guó)家級(jí)專精特新“小巨人”企業(yè),只用了六年。

打開網(wǎng)易新聞 查看精彩圖片

去年,浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院教授、中國(guó)工程院院士陳純?cè)菏浚ㄖ校┮恍性L問實(shí)在智能公司

今年,實(shí)在智能在日本設(shè)立了子公司,AI數(shù)字員工已經(jīng)在日本近百家大公司正式上崗。

文 | 沈積慧

VIEW MORE

@一舉包攬全球前三,杭州成了開源大模型之城?>>

@15年后他再次站到黃仁勛旁邊 >>

@我們用吉普力的畫風(fēng)重新演繹“來自東方的力量” >>

@華人“芯”事>>