
百圖生科技術(shù)副總裁張曉明(圖片來(lái)源:受訪者提供)
新藥研發(fā)是人類發(fā)展中極具風(fēng)險(xiǎn)和復(fù)雜度、耗時(shí)最漫長(zhǎng)的技術(shù)研究領(lǐng)域之ー。
今年1月,英國(guó)《自然》雜志子刊《自然醫(yī)學(xué)》(Nature Medicine)發(fā)表的一篇論文顯示,平均而言,新藥的研發(fā)投入約26億美元,可能需要耗時(shí)12-15年,但不幸的是,即使在臨床試驗(yàn)階段,新藥的成功率也低于10%。
上述論文認(rèn)為,新藥研發(fā)復(fù)雜的原因在于,傳統(tǒng)藥物研發(fā)依賴于藥物開(kāi)發(fā)人員的經(jīng)驗(yàn)和反復(fù)試驗(yàn),尤其尋找潛在候選藥物需要探索的化學(xué)空間之大,而且監(jiān)管要求非常嚴(yán)格,滿足安全性、有效性和質(zhì)量標(biāo)準(zhǔn)可能是一項(xiàng)耗時(shí)且成本高昂的工作。因此,為了克服這些挑戰(zhàn),科學(xué)家們一直在積極探索新技術(shù)和新方法,以改進(jìn)藥物開(kāi)發(fā)流程。
如今,AI 技術(shù)的出現(xiàn),尤其是大模型在內(nèi)的生成式AI技術(shù),融入藥物開(kāi)發(fā)流程——靶點(diǎn)識(shí)別、藥物發(fā)現(xiàn)、臨床研究等,有望重塑傳統(tǒng)藥物研發(fā)模式,從而有效提升藥物研發(fā)效率。
最新數(shù)據(jù)顯示,目前全球已經(jīng)有3800家企業(yè)、4900家投資機(jī)構(gòu)入局AI生物領(lǐng)域,相比四年前筆者發(fā)表的《AI何以成“藥神”》深度文章中提到入局的300家企業(yè)、880家投資機(jī)構(gòu),分別增長(zhǎng)了1166.7%、456.8%,增長(zhǎng)趨勢(shì)十分明顯。據(jù)麥肯錫全球研究院預(yù)測(cè),生成式AI技術(shù)將為制藥和醫(yī)療技術(shù)公司每年創(chuàng)造600億-1100億美元的經(jīng)濟(jì)價(jià)值。
百圖生科技術(shù)副總裁張曉明對(duì)鈦媒體AGI表示,未來(lái)5-10年,AI制藥產(chǎn)業(yè)可能將迎來(lái)爆發(fā)期。因此,需要行業(yè)堅(jiān)持持續(xù)做深度、做創(chuàng)新、應(yīng)用極致的前沿技術(shù)成果,加速整個(gè)藥物發(fā)現(xiàn)閉環(huán),在行業(yè)爆發(fā)中走在前列。
成立于2020年的BioMap百圖生科,是一家生命科學(xué)大模型平臺(tái)公司,由百度創(chuàng)始人、CEO李彥宏和原百度集團(tuán)副總裁、BV百度風(fēng)投CEO劉維共同創(chuàng)立,核心團(tuán)隊(duì)包括原諾和諾德全球副總裁、原SAP全球副總裁等資深高管,和100余人的核心研發(fā)團(tuán)隊(duì)。
經(jīng)過(guò)近五年的發(fā)展,百圖生科已經(jīng)成為生命科學(xué)基礎(chǔ)大模型的全球領(lǐng)跑者。截至目前,百圖生科總?cè)谫Y金額2億美元(約合人民幣14.54億元)左右,已擁有上千億參數(shù)量的全模態(tài)生物大模型xTrimo V3;覆蓋7種生物學(xué)跨模態(tài);超200款SOTA任務(wù)模型;服務(wù)全球500多家客戶,包括60余所QS世界百?gòu)?qiáng)大學(xué)和賽諾菲等多家跨國(guó)藥企;潛在訂單價(jià)值達(dá)20億美元。
目前,百圖生科已構(gòu)建覆蓋信息搜集-生物洞察-智能實(shí)驗(yàn)的全流程AI發(fā)現(xiàn)平臺(tái),助力生命科學(xué)企業(yè)實(shí)現(xiàn)研發(fā)效率提升、加速業(yè)務(wù)閉環(huán)。
今年4月25日,百圖生科發(fā)布全球首個(gè)AI生命科學(xué)基礎(chǔ)大模型驅(qū)動(dòng)的生成式發(fā)現(xiàn)系統(tǒng)——百圖生科生命科學(xué)生成式發(fā)現(xiàn)系統(tǒng)。
其中,發(fā)現(xiàn)系統(tǒng)的核心是“發(fā)現(xiàn)助手”這一超級(jí)入口。據(jù)張曉明介紹,“發(fā)現(xiàn)助手”內(nèi)置深度搜索功能,提供深度推理、數(shù)據(jù)增強(qiáng)、任務(wù)執(zhí)行、組學(xué)預(yù)測(cè)等技術(shù)能力,通過(guò)智能交互理解需求,自動(dòng)執(zhí)行多維度信息檢索與分析,最終生成結(jié)構(gòu)化深度報(bào)告,是全球率先在生命科學(xué)領(lǐng)域推出的專屬DeepResearch,同時(shí)也是更懂生命科學(xué)領(lǐng)域的知識(shí)助手。
BioASQ等多個(gè)行業(yè)評(píng)測(cè)結(jié)果顯示,“發(fā)現(xiàn)助手”在生命科學(xué)領(lǐng)域的表現(xiàn)中領(lǐng)先于DeepSeek-R1、OpenAI-o1-mini等其他通用AI產(chǎn)品,體現(xiàn)了生命科學(xué)領(lǐng)域的專業(yè)度。此外,百圖生科還面向特定領(lǐng)域提供創(chuàng)新系統(tǒng)方案,如智能發(fā)酵和智能細(xì)胞分析系統(tǒng),旨在以專業(yè)模型+高通量實(shí)驗(yàn)的干濕閉環(huán)能力幫助客戶提升發(fā)現(xiàn)效率。
張曉明對(duì)鈦媒體AGI表示,目前,百圖生科為客戶提供SaaS和私有部署的“發(fā)現(xiàn)助手”,合作客戶包括清華大學(xué)生物醫(yī)學(xué)工程學(xué)院、中國(guó)農(nóng)業(yè)科學(xué)院、石藥集團(tuán)等。
張曉明指出,與業(yè)內(nèi)已有的大模型企業(yè)的產(chǎn)品和方案相比,百圖生科“發(fā)現(xiàn)助手”更專注于AI For Life Science生命科學(xué)賽道,深度整合公司在生物數(shù)據(jù)理解和生命科學(xué)行業(yè)的深入經(jīng)驗(yàn),希望“發(fā)現(xiàn)助手”最終成為生命科學(xué)領(lǐng)域“專業(yè)-可執(zhí)行-專屬”超級(jí)助手,利用高效、先進(jìn)的生成式AI技術(shù)助力藥物研發(fā)等多個(gè)領(lǐng)域,以生成式發(fā)現(xiàn)系統(tǒng)構(gòu)建生命科學(xué)大模型應(yīng)用落地,打造成為生命科學(xué)行業(yè)智能化轉(zhuǎn)型的最佳伙伴。
張曉明表示,下一步,“發(fā)現(xiàn)助手”產(chǎn)品將會(huì)持續(xù)迭代,發(fā)揮百圖生科的 AI 技術(shù)優(yōu)勢(shì),逐步構(gòu)建起一套獨(dú)具特色的商業(yè)壁壘,為企業(yè)和相關(guān)研發(fā)機(jī)構(gòu)提供低成本、實(shí)用能力強(qiáng)、信息內(nèi)容更可靠的生命科學(xué)AI平臺(tái)。
張曉明強(qiáng)調(diào),在未來(lái)半年至一年的時(shí)間里,隨著產(chǎn)品能力的不斷深化,百圖生科在自身專注的領(lǐng)域中有望展現(xiàn)出更穩(wěn)固的優(yōu)勢(shì)和更鮮明的定位。
以下是百圖生科技術(shù)副總裁張曉明與鈦媒體AGI對(duì)話速記整理(有部分刪減):
鈦媒體AGI:百圖生科生命科學(xué)生成式發(fā)現(xiàn)系統(tǒng)的核心產(chǎn)品“發(fā)現(xiàn)助手”,為何說(shuō)是第一個(gè)生命科學(xué)專屬DeepResearch?
張曉明:深度搜索(DeepResearch)只是它其中的一個(gè)核心能力,整體主要做生命科學(xué)研究,會(huì)根據(jù)你提供的課題出一個(gè)深度研究報(bào)告,從而節(jié)省前沿技術(shù)研究人員的時(shí)間和精力。雖然像 OpenAI 也推出了類似的功能,但他們的服務(wù)更偏向通用場(chǎng)景,這就導(dǎo)致在面對(duì)生命科學(xué)這種非常專業(yè)的領(lǐng)域時(shí),大模型可能會(huì)出現(xiàn)一些不夠準(zhǔn)確的結(jié)果。而我們是完全專注于生命科學(xué),所以在專業(yè)性上更有優(yōu)勢(shì)。
事實(shí)上,生命科學(xué)領(lǐng)域是有很多專屬網(wǎng)站知識(shí)庫(kù)和權(quán)威數(shù)據(jù)源,需要專門(mén)面向生命科學(xué)行業(yè)方向的相關(guān)產(chǎn)品,而百圖生科生命科學(xué)生成式發(fā)現(xiàn)系統(tǒng),可以切實(shí)幫助到我們的客戶去解決實(shí)際場(chǎng)景下的成本、人員效率等相關(guān)問(wèn)題和需求。
當(dāng)下,我們的戰(zhàn)略重心放在企業(yè)級(jí)市場(chǎng),而不是直接面向C端消費(fèi)者。我們更希望生命科學(xué)領(lǐng)域的企業(yè)員工能夠高效地使用我們的產(chǎn)品,解決他們?cè)趯?shí)際工作中的難題,實(shí)現(xiàn)內(nèi)部增效。因此,我們沒(méi)有計(jì)劃進(jìn)行通用C端用戶的擴(kuò)展,而是堅(jiān)定地聚焦于企業(yè)實(shí)際應(yīng)用場(chǎng)景,通過(guò)我們的專業(yè)能力,實(shí)實(shí)在在地幫助客戶提升研發(fā)效率、加速創(chuàng)新進(jìn)程。
鈦媒體AGI:這款產(chǎn)品是什么時(shí)候開(kāi)始立項(xiàng)的?這個(gè)過(guò)程中有哪些挑戰(zhàn)?
張曉明:去年10月,我們做了AI智能體等基礎(chǔ)技術(shù),當(dāng)時(shí)Agent概念對(duì)于客戶來(lái)說(shuō),可能還相對(duì)新和超前。因此,我們是將前期的技術(shù)積累沉淀,并在今年真正做這款產(chǎn)品,尤其DeepSeek興起使得無(wú)人不談大模型,它確實(shí)是一個(gè)非常明確的信號(hào)。所以,如今是一個(gè)非常好的契機(jī),把之前積累的技術(shù)和產(chǎn)品,為生命科學(xué)行業(yè)提供服務(wù)。
鈦媒體AGI:“發(fā)現(xiàn)助手”與深勢(shì)科技的玻爾平臺(tái)有何區(qū)別?
張曉明:區(qū)別還是挺大的。玻爾基于深挖科學(xué)文獻(xiàn)理解的基礎(chǔ)之上給予文獻(xiàn)判斷和總結(jié),這是它的核心功能點(diǎn)。
百圖生科生命科學(xué)“發(fā)現(xiàn)助手”上文獻(xiàn)只是眾多信源之一,還有更多的高質(zhì)量數(shù)據(jù)源,包括百圖自身構(gòu)建的大型生命科學(xué)數(shù)據(jù)圖譜、專屬知識(shí)庫(kù)、行業(yè)調(diào)研報(bào)告、搜索引擎尋找等數(shù)據(jù)也可以直接用,并且在這些數(shù)據(jù)源上做深度搜索,實(shí)現(xiàn)了DeepResearch的能力。并且提供了生信分析的功能,實(shí)際可執(zhí)行,更直接的提高了發(fā)現(xiàn)效率。
鈦媒體AGI:百圖生科生命科學(xué)生成式xtrimo“發(fā)現(xiàn)助手”,是否與王小川百川智能的醫(yī)療AI平臺(tái)產(chǎn)生競(jìng)爭(zhēng)關(guān)系?
張曉明:這是一個(gè)非常好的問(wèn)題。確實(shí)我們?cè)谧龆ㄎ坏臅r(shí)候,第一天就考慮了這個(gè)問(wèn)題。
我們認(rèn)為,臨床問(wèn)診和生命科學(xué)研發(fā)之間其實(shí)有一條分界線。如果做醫(yī)療問(wèn)診,就更偏醫(yī)療、臨床等上層鏈條,需要和醫(yī)院和衛(wèi)健委相關(guān)機(jī)構(gòu)形成生態(tài),更好的理解患者的檢測(cè)報(bào)告和患者對(duì)話;而我們更關(guān)注底層生命科學(xué)機(jī)理層面,比如藥物設(shè)計(jì)里邊的靶點(diǎn)發(fā)現(xiàn)、細(xì)胞分析等Science問(wèn)題,要理解的也是原始的科學(xué)數(shù)據(jù),所以,兩個(gè)生態(tài)和技術(shù)都是不重疊的。
鈦媒體AGI:“發(fā)現(xiàn)助手”調(diào)用的是哪家大模型?為何首批沒(méi)接入百度文心大模型?
張曉明:目前,“發(fā)現(xiàn)助手”調(diào)用了多個(gè)大模型,首先是我們研發(fā)的生命科學(xué)專屬多模態(tài)模型,BioMap xTrimo大模型所帶來(lái)的專業(yè)能力,作為補(bǔ)充的才是阿里Qwen、DeepSeek等自然語(yǔ)言大模型,通用領(lǐng)域文本推理模型,在這個(gè)層面上,我們會(huì)接入和調(diào)用不同廠商的大模型產(chǎn)品,在眾多推理模型之上進(jìn)行組合使用。我們不僅需要基于文本和數(shù)學(xué)的推理過(guò)程,更要讓它學(xué)會(huì)生物推理任務(wù)。
最后談?wù)剤?zhí)行任務(wù)過(guò)程。
我們確實(shí)希望給出專業(yè)的問(wèn)答,所以利用百圖生科的生命科學(xué)領(lǐng)域圖譜和業(yè)界專業(yè)數(shù)據(jù)庫(kù),通過(guò)推理把每一步路徑執(zhí)行和輸出,多輪獲取參考源的信息,并行觸發(fā)15路及更多語(yǔ)言搜索,如果內(nèi)容質(zhì)量不夠會(huì)重新優(yōu)化再搜索,經(jīng)過(guò)多輪執(zhí)行,讓這個(gè)信息直接可用,并且有權(quán)威性、不會(huì)帶來(lái)過(guò)多幻覺(jué),才輸出給用戶。
我認(rèn)為,當(dāng)下幻覺(jué)是沒(méi)有辦法100%消除的,只能通過(guò)各種技術(shù)手段把幻覺(jué)概率降低,讓這個(gè)報(bào)告變得真正有用,而不是生成一個(gè)報(bào)告格式的非事實(shí)內(nèi)容。所以,我們犧牲了響應(yīng)速度,而更加傾向于實(shí)現(xiàn)更好的體驗(yàn)、更實(shí)用且真正可執(zhí)行的平臺(tái)。
鈦媒體AGI:談?wù)勆虡I(yè)化。為什么百圖生科“發(fā)現(xiàn)助手”平臺(tái)不提供類似智譜的API接口進(jìn)行銷(xiāo)售?
張曉明:當(dāng)下其實(shí)我們沒(méi)有API,隨著發(fā)現(xiàn)助手能力逐步提升,標(biāo)準(zhǔn)版本可以更好的幫助到企業(yè)客戶時(shí),我們可以再考慮開(kāi)發(fā)API。當(dāng)前,我們認(rèn)為需要為企業(yè)用戶做一定定制,接入了企業(yè)自己的專屬數(shù)據(jù)的版本,打造企業(yè)專屬的助手效果更顯著。
鈦媒體AGI:三種交付模式SaaS、私有部署和一體機(jī)下,百圖生科的市場(chǎng)競(jìng)爭(zhēng)力是什么?
張曉明:就百圖生科生命科學(xué)生成式發(fā)現(xiàn)系統(tǒng)而言,我們的SaaS是以平臺(tái)方式讓客戶進(jìn)行試用和體驗(yàn),然后會(huì)對(duì)這些功能有一個(gè)直接判斷,真正我們向客戶提供的是一套企業(yè)級(jí)私有部署方案。
事實(shí)上,生命科學(xué)行業(yè)具有專屬的管線、靶點(diǎn)等比較機(jī)密的數(shù)據(jù),不愿意在公共平臺(tái)使用,所以,大部分企業(yè)和科研機(jī)構(gòu)依然采用私有部署方式,而SaaS更多提供試用和體驗(yàn),但并非我們主要向客戶提供的交付模式。
私有部署有兩種形式:一種是用戶自身?yè)碛凶越?,我們把軟件系統(tǒng)方案部署上面;另一種如果用戶有云服務(wù),我們可以幫助他們構(gòu)建私有云的軟件系統(tǒng)部署。此外,我們還會(huì)與百度智能云、中科海光等提供國(guó)產(chǎn)硬件一體機(jī)交付能力。相對(duì)于其他一體機(jī)產(chǎn)品,我們注意力在生命科學(xué)范圍里面尋找高質(zhì)量客戶,更期待幫助他們提高效率,以及通過(guò)他們的使用反饋產(chǎn)品不斷迭代升級(jí)。這是我們提供上述多種形式交付模式的原因。
鈦媒體AGI:百圖生科目前對(duì)外提供藥物研發(fā)、生物制造、AI4LS平臺(tái)解決方案等。那么,這次新的百圖生科生命科學(xué)生成式發(fā)現(xiàn)系統(tǒng)產(chǎn)品,是結(jié)合解決方案一起提供,還是單獨(dú)銷(xiāo)售?
張曉明:百圖生科生命科學(xué)“發(fā)現(xiàn)助手”是企業(yè)級(jí)的發(fā)現(xiàn)提效方案。我們現(xiàn)在主要提供定制的、垂直的助手賦能客戶提效,這也是我們解決方案的一部分。與更多針對(duì)特定垂直領(lǐng)域的重度解決方案相比,發(fā)現(xiàn)助手是一個(gè)最便捷和廣泛服務(wù)專業(yè)客戶需求的解決方案,也可以和垂直解決方案聯(lián)合使用。
鈦媒體AGI:清華大學(xué)也有智譜、百川智能這類大模型公司,為什么清華大學(xué)生物醫(yī)學(xué)工程學(xué)院選擇與百圖生科合作?
張曉明:主要還是因?yàn)槲覀冊(cè)谶^(guò)去四五年間一直深耕生命科學(xué)基礎(chǔ)大模型,在生物問(wèn)題上有我們的獨(dú)特優(yōu)勢(shì)。劉鵬教授(清華大學(xué)生物醫(yī)學(xué)工程學(xué)院黨委書(shū)記、教授)團(tuán)隊(duì)和我們有很深度的合作,他們?yōu)槲覀冞@款產(chǎn)品打磨提供了非常多原始需求和實(shí)際反饋,而我們幫助他們解決課題挖掘、知識(shí)問(wèn)答、報(bào)告撰寫(xiě)、報(bào)告潤(rùn)色等痛點(diǎn)需求,核心在于我們比其他AI產(chǎn)品更懂生物,更能夠理解和解決深層次問(wèn)題。
鈦媒體AGI:目前整個(gè)平臺(tái)處于試用狀態(tài),那么百圖生科團(tuán)隊(duì)如何去做留存?如何實(shí)現(xiàn)商業(yè)壁壘?
張曉明:我們剛發(fā)布發(fā)現(xiàn)助手產(chǎn)品,所以當(dāng)下客戶都處于靈活試用狀態(tài)。
下一步,我們不斷完善產(chǎn)品功能,深度溝通用戶需求,真正解決實(shí)際問(wèn)題,當(dāng)前主要還是作為一個(gè)客戶解決方案,去關(guān)注專業(yè)用戶的使用滿意度。長(zhǎng)期而言,它會(huì)是一個(gè)面向生命科學(xué)領(lǐng)域場(chǎng)景的整體、統(tǒng)一的“超級(jí)”助手,在調(diào)用各種更深入的解決方案和功能上,乃至在整合用戶的其他工具和數(shù)據(jù)上,都可以發(fā)揮作用,屆時(shí)客戶會(huì)對(duì)此形成長(zhǎng)期的用戶黏性。
至于商業(yè)壁壘,我們剛剛進(jìn)入這個(gè)領(lǐng)域,從原來(lái)服務(wù)少數(shù)專業(yè)領(lǐng)域的深度需求,到現(xiàn)在面向更廣泛的需求提供方案,還談不上壁壘。但我們的思考是,真正的壁壘在于充分利用我們生命科學(xué)多模態(tài)的大模型,生命科學(xué)專業(yè)數(shù)據(jù),在功能上滿足自然語(yǔ)言大模型單純滿足不了的真實(shí)需求,真正可執(zhí)行的幫助客戶解決專業(yè)問(wèn)題。
鈦媒體AGI:我們提供的服務(wù)當(dāng)中,硬件成本很高,而且發(fā)現(xiàn)助手還是免費(fèi)對(duì)外提供,百圖生科如何在這一業(yè)務(wù)中實(shí)現(xiàn)盈利?
張曉明:和其他大模型Agent產(chǎn)品一樣,前期我們確實(shí)要投入一些成本給用戶免費(fèi)試用和體驗(yàn)。但作為一個(gè)專業(yè)方案,用戶在獲取發(fā)現(xiàn)助手的高級(jí)功能、完整方案、做專屬的功能定制時(shí),還是會(huì)給我們帶來(lái)商業(yè)收益。
從成本角度上,因?yàn)椤鞍l(fā)現(xiàn)助手”是回答和解決生命科學(xué)場(chǎng)景的問(wèn)題,相對(duì)通用助手來(lái)說(shuō)使用頻次并不高,我們?cè)诖竽P偷挠?xùn)練和推理優(yōu)化方面積累了大量 AI 工程能力,實(shí)現(xiàn)了多輪性能優(yōu)化,從而降低了我們的服務(wù)成本。
鈦媒體AGI:之前百圖生科與賽諾菲簽訂合作,外界認(rèn)為百圖生科專做AI生物制藥平臺(tái)。但今天我們看到,除了“發(fā)現(xiàn)助手”之外,百圖生科還提供智能發(fā)酵方案,那么,我們?nèi)绾卫斫獍賵D生科所在的AI生物制藥領(lǐng)域的發(fā)展?
張曉明:其實(shí)公司的定位一直是一個(gè)生物計(jì)算平臺(tái)、生命科學(xué)大模型平臺(tái),我們比專注于任何一個(gè)具體領(lǐng)域的AI生物公司,都更自豪于我們基于基礎(chǔ)大模型能力帶來(lái)的領(lǐng)域擴(kuò)展?jié)摿?。賽諾菲是我們最早的商業(yè)化客戶之一,是在生物制藥領(lǐng)域的,這一年多來(lái)其實(shí)我們的付費(fèi)客戶已經(jīng)擴(kuò)展到細(xì)胞基因療法、生命科學(xué)基礎(chǔ)研究、農(nóng)業(yè)和動(dòng)物生物學(xué)、生物材料等很多領(lǐng)域,因?yàn)榈讓拥牡鞍缀图?xì)胞等基礎(chǔ)大模型的高度關(guān)聯(lián)性。
在中國(guó),我們特別重視生物制造領(lǐng)域的發(fā)展,因?yàn)檫@是中國(guó)產(chǎn)業(yè)戰(zhàn)略中非常關(guān)鍵的一環(huán),也是充分利用我們對(duì)生物反應(yīng)過(guò)程的理解而能帶來(lái)的重要效率提升進(jìn)空間,我們很看好以智能發(fā)酵為代表的智能生物工藝發(fā)現(xiàn)系統(tǒng)的前景,和我們的智能抗體、智能細(xì)胞分析系統(tǒng)一起,會(huì)成為我們給客戶的核心解決方案之一。
(本文首發(fā)于鈦媒體App,作者|林志佳)
熱門(mén)跟貼