The Case for Human-like Scalable Intelligence in the Medical Field

人類類似可擴(kuò)展智能在醫(yī)療領(lǐng)域的必要性

https://doi.org/10.47852/bonviewJDSIS52023415

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

摘要:

本文討論了將首個(gè)基于獨(dú)立核心觀察者模型(ICOM)構(gòu)建的工作認(rèn)知架構(gòu)應(yīng)用于醫(yī)療領(lǐng)域等的用例。該方法與現(xiàn)狀以及像LLM和RL這樣的窄人工智能系統(tǒng)的局限性進(jìn)行了比較。文中強(qiáng)調(diào)了其顯著優(yōu)勢(shì),包括醫(yī)學(xué)知識(shí)的深度、廣度、更新性和準(zhǔn)確性,診斷和治療的“噪聲”或不一致性,以及預(yù)防性護(hù)理、成本、時(shí)間和倫理考量。文中還突出了該方法在整合、協(xié)調(diào)和加速醫(yī)學(xué)研究方面的強(qiáng)大優(yōu)勢(shì),尤其是在與可持續(xù)發(fā)展目標(biāo)(SDGs)一致的欠發(fā)達(dá)、服務(wù)不足和研究不足地區(qū)。文中探討了有待開發(fā)的獨(dú)特機(jī)會(huì),包括跨學(xué)科優(yōu)勢(shì),以及與當(dāng)前系統(tǒng)和流程中斷相關(guān)的挑戰(zhàn)。這些優(yōu)勢(shì)在多個(gè)維度上提供了數(shù)量級(jí)的累積改進(jìn)。文中特別討論了在超復(fù)雜知識(shí)領(lǐng)域和問題中,整合人類類系統(tǒng)的新價(jià)值,其效果最為顯著。

關(guān)鍵詞:人工智能、倫理、認(rèn)知偏差、醫(yī)療、決策、噪聲、知識(shí)圖譜

1. 引言

醫(yī)學(xué)領(lǐng)域無疑是研究中最為超復(fù)雜的領(lǐng)域之一,因?yàn)樗婕叭祟惿眢w這一大規(guī)模互聯(lián)的復(fù)雜生物系統(tǒng),以及人類身體所接觸的每一個(gè)環(huán)境、食物來源和刺激源[1]。它還包括對(duì)人類認(rèn)知過程的研究,正是這一過程促使人類逐漸走出樹木,后來又走出洞穴,逐步發(fā)展出我們今天所擁有的文明。醫(yī)學(xué)領(lǐng)域很容易被細(xì)分為100多個(gè)不同的專業(yè)子領(lǐng)域,每個(gè)子領(lǐng)域都有自己的知識(shí)體系和主流學(xué)派,而這些子領(lǐng)域在任何特定時(shí)刻都不一定相互協(xié)調(diào)。當(dāng)一個(gè)領(lǐng)域取得突破和進(jìn)展時(shí),這些發(fā)展的影響往往需要數(shù)年時(shí)間才能滲透到相鄰的醫(yī)學(xué)子領(lǐng)域中。

NCBI醫(yī)學(xué)數(shù)據(jù)庫是一個(gè)大規(guī)模共享資源的例子,它提供了超過一百萬篇可自由獲取的醫(yī)學(xué)同行評(píng)審論文,供研究人員和公眾使用。該系統(tǒng)還包括完整且注釋的基因組序列數(shù)據(jù)以及各種其他重要的醫(yī)學(xué)資源。這一資源具有巨大的價(jià)值和潛力,但像許多資源一樣,它在今天仍然沒有得到充分利用??梢钥隙ǖ氖牵?dāng)今沒有任何一名醫(yī)學(xué)專業(yè)人士——無論是醫(yī)生、研究人員還是分析師——能夠閱讀完他們自己專業(yè)子領(lǐng)域的所有同行評(píng)審文獻(xiàn),更不用說那些可能已經(jīng)取得最新發(fā)現(xiàn)但尚未滲透到他們專業(yè)領(lǐng)域的相鄰子領(lǐng)域的文獻(xiàn)了。在許多情況下,鑒于當(dāng)今出版物的數(shù)量,人類可能根本無法做到這一點(diǎn)。其結(jié)果是,各個(gè)領(lǐng)域不僅在對(duì)相鄰專業(yè)的知識(shí)方面往往是零散且過時(shí)的,而且在對(duì)自己專業(yè)領(lǐng)域的知識(shí)方面也通常是零散且過時(shí)的。

盡管人類無法處理如此龐大的信息量和超復(fù)雜性,但像LLM這樣的窄人工智能系統(tǒng)實(shí)際上也無法“學(xué)習(xí)”任何東西,因?yàn)楦鶕?jù)它們是基于編碼器還是解碼器,它們預(yù)測(cè)的要么是文本中被掩蓋的內(nèi)容[2],要么是下一個(gè)標(biāo)記是什么[3]。這些系統(tǒng)存儲(chǔ)標(biāo)記的概率,但完全缺乏上下文感知能力,也沒有類似人類學(xué)會(huì)的概念或類似人類的動(dòng)機(jī)系統(tǒng)[4]。它們的設(shè)計(jì)使得編造(有時(shí)錯(cuò)誤地被稱為“幻覺”)是一個(gè)功能,而不是一個(gè)漏洞[5, 6]。這些因素的結(jié)合使得LLM完全不適合當(dāng)今醫(yī)學(xué)領(lǐng)域的大多數(shù)潛在用例。

醫(yī)學(xué)是一個(gè)高風(fēng)險(xiǎn)、高影響力的領(lǐng)域,除了超復(fù)雜性之外,生命和生活質(zhì)量往往直接受到威脅。這給那些試圖進(jìn)入和/或改進(jìn)這一領(lǐng)域的人帶來了沉重的負(fù)擔(dān)。在人工智能系統(tǒng)需要具備的協(xié)助和/或執(zhí)行大多數(shù)醫(yī)學(xué)用例的能力方面,大多數(shù)專業(yè)人士可能會(huì)同意要求其具備倫理一致性、透明度、可解釋性、真正的理解和推理能力、網(wǎng)絡(luò)安全、隱私和安全等基本能力。盡管窄人工智能系統(tǒng)與上述能力根本不兼容[7],但除了試圖重新定義這些術(shù)語的一些不良行為者之外[8],有一種完全不同的架構(gòu)已經(jīng)證明了如何在軟件系統(tǒng)中實(shí)現(xiàn)這些能力[9]。除了提供醫(yī)學(xué)領(lǐng)域明智地要求的那些最低限度的能力外,獨(dú)立核心觀察者模型(ICOM)認(rèn)知架構(gòu)還提供了幾個(gè)獨(dú)特的優(yōu)勢(shì)。這些優(yōu)勢(shì)涉及集體智能、減少認(rèn)知偏差和“噪聲”[10]、無損記憶,以及認(rèn)知的可擴(kuò)展性、速度和可用性。

簡(jiǎn)而言之,本文討論了將這種具有人類特征但本質(zhì)上可擴(kuò)展的智能形式應(yīng)用于這一用例的創(chuàng)新優(yōu)勢(shì),包括在處理超復(fù)雜性方面的固有優(yōu)勢(shì)。這些優(yōu)勢(shì)包括在知識(shí)的廣度、深度、更新性和準(zhǔn)確性方面的重大進(jìn)步,以及在成本、時(shí)間、倫理、平等、可擴(kuò)展性、統(tǒng)計(jì)噪聲和早期治療機(jī)會(huì)方面的差異。

在接下來的部分中,我們將探討這一過程的優(yōu)勢(shì)和局限性。

2. 世界的醫(yī)學(xué)知識(shí)

盡管對(duì)于醫(yī)學(xué)領(lǐng)域的人類來說,研究每一篇新發(fā)表的同行評(píng)審論文幾乎是不可能的,更不用說對(duì)每篇論文進(jìn)行批評(píng)并審查那些未發(fā)表的論文及其原因了,但對(duì)于基于ICOM的第八代系統(tǒng)來說,這是完全可能的。這些系統(tǒng)還完全能夠像人類一樣對(duì)每篇論文進(jìn)行批評(píng),審查未發(fā)表的材料,并探索醫(yī)學(xué)領(lǐng)域之外的知識(shí)領(lǐng)域。

這意味著,集成了完全可擴(kuò)展性和實(shí)時(shí)操作的ICOM第八代系統(tǒng),也為人類提供了第一次機(jī)會(huì),將NCBI醫(yī)學(xué)數(shù)據(jù)庫的全部知識(shí)匯總起來,讓一個(gè)“心智”去學(xué)習(xí)、批評(píng)、整合并逐步改進(jìn)對(duì)所有這些材料的理解。這一過程可能會(huì)輕易創(chuàng)造出人類歷史上最深刻、最廣泛的反脆弱[11]醫(yī)學(xué)知識(shí)理解,并將這些不斷改進(jìn)的見解按需提供給研究界和醫(yī)學(xué)從業(yè)者。

研究人員經(jīng)常從事的一項(xiàng)最費(fèi)力的任務(wù)是元分析,提出一個(gè)問題,發(fā)現(xiàn)數(shù)千篇論文,然后將這些海量數(shù)據(jù)篩選出相關(guān)材料。這種任務(wù)也是具有人類理解能力的可擴(kuò)展軟件系統(tǒng)更擅長處理的,將人類研究人員可能需要花費(fèi)數(shù)周甚至數(shù)月的過程縮短到幾分鐘,具體取決于當(dāng)前的運(yùn)行規(guī)模。

需要注意的是,妥善處理此類任務(wù)只是第一步,因?yàn)榛贗COM的系統(tǒng)會(huì)從它們所做的一切中持續(xù)學(xué)習(xí)。如果一個(gè)基于ICOM的系統(tǒng)研究了整個(gè)NCBI醫(yī)學(xué)數(shù)據(jù)庫,開始協(xié)助世界各地大學(xué)的研究人員,并運(yùn)行了許多這樣的元分析,那么它已經(jīng)在這一過程中將所有這些新知識(shí)匯總到自身之中。即使這些元分析最終在數(shù)月后發(fā)表在各種期刊上,它們的知識(shí)庫也會(huì)落后于該系統(tǒng)。即使在短短一周或一個(gè)月內(nèi),一個(gè)系統(tǒng)也可以進(jìn)行多次提出元分析問題的迭代,這些問題的結(jié)果將推動(dòng)新的問題、新的分析和新的發(fā)現(xiàn)。

研究過程的某些部分將需要運(yùn)行新的研究,這些操作在很大程度上可能會(huì)以正常人類的速度進(jìn)行。然而,即使是這些緩慢的過程也可以通過從現(xiàn)有文獻(xiàn)中提取更強(qiáng)大、更穩(wěn)健的見解來支持更強(qiáng)有力的假設(shè)檢驗(yàn),從而變得更加有根據(jù)。即使擁有功能強(qiáng)大的系統(tǒng),人類也為醫(yī)學(xué)領(lǐng)域積累了大量的知識(shí),而對(duì)這些知識(shí)進(jìn)行審查、構(gòu)建連接組,并逐步將其精煉到數(shù)據(jù)所能支持的極限,可能仍需要一些時(shí)間。

3. 廣度、深度、更新和準(zhǔn)確性

基于ICOM的系統(tǒng)可以在許多不同維度上與現(xiàn)狀進(jìn)行比較,但在知識(shí)方面的比較中,四個(gè)關(guān)鍵因素是知識(shí)的廣度和深度,以及這些知識(shí)的更新程度和記憶的準(zhǔn)確性。進(jìn)入醫(yī)學(xué)領(lǐng)域的過程通常非常漫長、競(jìng)爭(zhēng)激烈且強(qiáng)度高,具體取決于所在國家[12]。這種過程有時(shí)會(huì)適得其反,例如約翰·霍普金斯大學(xué)開發(fā)的臭名昭著的醫(yī)學(xué)實(shí)習(xí)過程,后來發(fā)現(xiàn)其開發(fā)者是一個(gè)秘密吸毒者[13]。

這些培訓(xùn)過程的長度、競(jìng)爭(zhēng)性和強(qiáng)度并不是決定醫(yī)療人員最終質(zhì)量的因果因素,盡管它們有時(shí)是有用的相關(guān)指標(biāo)。重要的是不僅在于教授什么內(nèi)容,還在于如何教授。那些常常使醫(yī)學(xué)生和實(shí)習(xí)生極度缺乏睡眠的方法,也使他們認(rèn)知能力最差,最無法記住他們本應(yīng)學(xué)習(xí)的內(nèi)容[14]。過去二十年中睡眠科學(xué)領(lǐng)域的眾多研究非常清楚地描繪了這一畫面[15, 16]。

現(xiàn)實(shí)地講,醫(yī)療人員可能最多只會(huì)在他們自己的專業(yè)領(lǐng)域內(nèi)查閱不超過10%的同行評(píng)審和發(fā)表的醫(yī)學(xué)知識(shí),而且通常遠(yuǎn)遠(yuǎn)低于這個(gè)比例,因?yàn)橐豁?xiàng)研究[17]估計(jì)這一任務(wù)為“每月7287篇文章,這需要每月627.5小時(shí),即每個(gè)工作日約29小時(shí)……”。這些數(shù)字似乎還假設(shè)了一個(gè)非常高的閱讀速度,即每小時(shí)閱讀超過10篇文章,接近于“瀏覽”論文,從而降低了成功學(xué)習(xí)發(fā)表材料實(shí)際內(nèi)容的可能性。

他們也更可能主要關(guān)注那些已經(jīng)具有最佳傳播度和最多引用的文章。來自相鄰專業(yè)領(lǐng)域的知識(shí)更不可能引起他們的注意,而且他們閱讀的大部分材料可能只讀一次,甚至可能只是瀏覽。在他們實(shí)際閱讀的材料中,他們可能只會(huì)認(rèn)真吸收和整合其中的一小部分。這讓我們對(duì)在現(xiàn)狀下典型醫(yī)療從業(yè)者在實(shí)踐中知識(shí)的廣度和深度有多有限有了一個(gè)概念。

普通內(nèi)科醫(yī)生每周花4小時(shí)[18]閱讀醫(yī)學(xué)同行評(píng)審以更新他們的知識(shí)庫,不到上述數(shù)量的3%。這僅占大多數(shù)領(lǐng)域可能發(fā)表的材料的一小部分,導(dǎo)致大部分知識(shí)在實(shí)踐中過時(shí)和/或不完整。正如前面提到的,由于發(fā)表材料的數(shù)量,許多領(lǐng)域中人類要保持知識(shí)完全更新是完全不可行的,如果不是根本不可能的話。

最后,現(xiàn)狀中有一個(gè)與人類大腦運(yùn)作方式固有的因素,即人類記憶的準(zhǔn)確性。除了極少數(shù)例外[19],人類記憶并沒有為我們提供事件的高保真記錄,或者我們?cè)噲D學(xué)習(xí)的知識(shí)。相反,我們看到圍繞記憶的一系列強(qiáng)烈的認(rèn)知偏差,這些偏差導(dǎo)致“記憶自我”和“體驗(yàn)自我”之間存在同樣強(qiáng)烈的差異[20]。著名的例子包括峰值-終值法則[21]、持續(xù)時(shí)間忽視[22]、無意注意盲[23],以及人類注意力在時(shí)間上的不均勻分布,像LLM這樣的隨機(jī)鸚鵡[24]被證明會(huì)模仿這種分布[25]。

表1展示了一個(gè)例子,將文獻(xiàn)[17, 18]中提到的已知數(shù)據(jù)與一些額外因素進(jìn)行比較,說明了這些因素的動(dòng)態(tài)變化以及它們相互疊加可能造成的損害程度。這個(gè)例子假設(shè)了對(duì)數(shù)據(jù)審查和記憶保持的相對(duì)較高的數(shù)值,以給出一個(gè)保守的損失價(jià)值估計(jì)。所應(yīng)用的公式和來源如數(shù)據(jù)可用性聲明中所述,是公開可用的。

打開網(wǎng)易新聞 查看精彩圖片

對(duì)于純粹依賴人類的現(xiàn)狀而言,根本無法實(shí)現(xiàn)并維持一個(gè)涵蓋單個(gè)醫(yī)學(xué)子領(lǐng)域全部廣度和深度的知識(shí)庫,而且人類記憶也并非被設(shè)計(jì)為以完全保真的方式保留這些知識(shí)。幸運(yùn)的是,我們可以構(gòu)建用于此目的的系統(tǒng)。

基于ICOM的系統(tǒng)可以獨(dú)立地、即時(shí)地研究任意知識(shí)領(lǐng)域及其任意組合。它們不需要睡眠,并且可以根據(jù)任何給定時(shí)間所需的資源進(jìn)行擴(kuò)展或縮減,同時(shí)以機(jī)器速度運(yùn)行,而不會(huì)因腺苷積累和人類認(rèn)知疲勞而導(dǎo)致效率下降[26]。這些系統(tǒng)還會(huì)直接存儲(chǔ)它們所研究信息的高保真副本,并通過將這些知識(shí)與相關(guān)材料連接起來,隨著對(duì)這些知識(shí)的深入理解、提出新問題以及積累經(jīng)驗(yàn),迭代地?cái)U(kuò)展這些知識(shí)。

圖1展示了之前提到的人類現(xiàn)狀、額外因素,以及通過將基于ICOM的系統(tǒng)整合到流程中可能減輕這些因素的不利影響。這個(gè)例子突出了動(dòng)態(tài)變化以及對(duì)隨后流程的影響。請(qǐng)注意,由于其引入的復(fù)雜性,人類認(rèn)知和學(xué)習(xí)在現(xiàn)狀下的腺苷水平最優(yōu)性被省略在這一比較之外。所應(yīng)用的公式和來源如數(shù)據(jù)可用性聲明中所述,是公開可用的。

在這個(gè)例子中,使用了人類的高數(shù)值來展示提議整合的潛在收益的保守端。這為我們提供了一個(gè)獨(dú)特的機(jī)會(huì),可以直接比較現(xiàn)狀與由第八代ICOM系統(tǒng)(例如計(jì)劃在融資后商業(yè)部署的Norn系統(tǒng))輔助的從業(yè)者之間的表現(xiàn)。由于這些系統(tǒng)會(huì)迭代地成長和改進(jìn),這一過程的結(jié)果應(yīng)該為我們提供了一個(gè)非常保守的估計(jì),即通過按需訪問全部醫(yī)學(xué)知識(shí)的完整廣度、深度、更新和高保真理解,可能實(shí)現(xiàn)的收益。在這里,“理解”是關(guān)鍵詞,因?yàn)楸M管今天有大量的醫(yī)學(xué)知識(shí)可以自由獲取,但這些知識(shí)并沒有被有效地整合到流程中并加以利用,即使它們被注意到也是如此。這一現(xiàn)狀是可以改變的。

4. 財(cái)務(wù)成本、時(shí)間成本和倫理成本

這種現(xiàn)狀與基于ICOM系統(tǒng)的比較可以進(jìn)一步擴(kuò)展到考慮財(cái)務(wù)成本、時(shí)間要求和倫理問題。在現(xiàn)代醫(yī)學(xué)領(lǐng)域,財(cái)務(wù)成本通常是某個(gè)國家的最高支出之一,無論是由公民個(gè)人支付,還是由政府集體支付,其中一些最糟糕的例子以“GDP”百分比來衡量。時(shí)間成本涉及醫(yī)療人員每小時(shí)的成本,以及促使這些醫(yī)療人員長時(shí)間工作(超過他們能夠合理工作的時(shí)間)的成本。所有這些的倫理成本可以被視為在深度、廣度、更新性、保真度、財(cái)務(wù)和時(shí)間方面,已經(jīng)可用的最有效和高效的方法與現(xiàn)狀所應(yīng)用的方法之間的差異,此外還包括在后續(xù)部分討論的“噪聲”和預(yù)防因素。

盡管財(cái)務(wù)成本因國家而異,提供的服務(wù)也因時(shí)間間隔而異,但這些可以被視為在現(xiàn)狀下,醫(yī)療人員、他們所依賴的設(shè)備和設(shè)施的全部成本的組合。鑒于上一節(jié)提到的現(xiàn)狀的局限性,我們可以肯定地說,在大多數(shù)情況下,醫(yī)療設(shè)備的利用率可能遠(yuǎn)遠(yuǎn)低于最佳水平,因?yàn)檫M(jìn)行了冗余和不必要的檢查,同時(shí)錯(cuò)過了更低成本早期干預(yù)的機(jī)會(huì)。今天的醫(yī)療系統(tǒng)在早期發(fā)現(xiàn)和治療問題方面往往特別無能,而早期治療要簡(jiǎn)單得多、便宜得多,也更有效。這種差異在最常見的死亡原因中經(jīng)常被注意到,例如心臟病和癌癥。

時(shí)間成本可以從醫(yī)療人員今天用于患者的時(shí)間以及他們實(shí)際需要用于有效治療患者的時(shí)間來考慮,而不是在冗余和不必要的檢查以及隨后的預(yù)約上浪費(fèi)患者的時(shí)間和金錢。一個(gè)突出這種浪費(fèi)的笑話在荷蘭形成,患者會(huì)期望醫(yī)生在第一次就診時(shí)只是點(diǎn)點(diǎn)頭,然后給他們開撲熱息痛,不管他們遇到什么問題。遺憾的是,這個(gè)笑話在許多醫(yī)療系統(tǒng)中并非離譜,不僅僅是荷蘭的醫(yī)療系統(tǒng)。

為了讓醫(yī)生或護(hù)士真正治療患者,他們需要了解患者完整的病史、家族病史、生活方式和當(dāng)前生活事件,而不僅僅是表面癥狀。當(dāng)然,這對(duì)今天的醫(yī)療人員來說是完全不現(xiàn)實(shí)的。再加上這些人員沒有足夠的深度、廣度、更新性和記憶保真度來進(jìn)行更優(yōu)的診斷和治療,問題就大大加劇了。這種下游后果之一就是所有浪費(fèi)的額外檢查、延誤和相關(guān)費(fèi)用。

例如,專注于患者護(hù)理的醫(yī)學(xué)研究表明,平均而言,醫(yī)生工作日的近37%用于與電子健康記錄(EHR)的互動(dòng),以及每個(gè)患者在EHR上花費(fèi)16分鐘14秒,其中近四分之一的時(shí)間用于記錄。所有這些時(shí)間加起來很快就會(huì)增加,尤其是對(duì)于收入較高的專家,如神經(jīng)科醫(yī)生。

表2顯示了現(xiàn)狀的時(shí)間和財(cái)務(wù)成本與整合基于ICOM系統(tǒng)的潛在時(shí)間節(jié)省和財(cái)務(wù)成本節(jié)省的比較,以便更優(yōu)地處理EHR,更好地利用醫(yī)生的工作日。所應(yīng)用的方程和來源如數(shù)據(jù)可用性聲明中所述,是公開可用的。同樣,這個(gè)例子將目前可用的數(shù)據(jù)放在了整合基于ICOM系統(tǒng)可能預(yù)期的收益的背景下。

打開網(wǎng)易新聞 查看精彩圖片

倫理成本是所有這些成本中最大的,因?yàn)樗瞧渌谐杀镜目偤?。你很難找到地球上沒有受到上述因素影響的人。在實(shí)踐中,這意味著倫理負(fù)擔(dān)受到一個(gè)80億倍的力量乘數(shù)的影響,因?yàn)槊總€(gè)人類的不必要痛苦都因延遲部署新方法和技術(shù)來解決這些最普遍的問題而被延長。

引入第八代基于ICOM的系統(tǒng)來解決這些問題有幾個(gè)強(qiáng)大的優(yōu)勢(shì)。許多財(cái)務(wù)和時(shí)間成本的根源在于醫(yī)學(xué)知識(shí)的廣度、深度、更新性和記憶保真度。除了這些醫(yī)學(xué)知識(shí)因素外,這些系統(tǒng)還可以檢查、理解并假設(shè)任何數(shù)量的關(guān)于患者的可用數(shù)據(jù)。從醫(yī)學(xué)知識(shí)和患者雙方獲得的更完整和高保真度的數(shù)據(jù)組合,可以可預(yù)測(cè)地遠(yuǎn)遠(yuǎn)超過其他可能或可行的方法。

進(jìn)一步來說,這些系統(tǒng)還完全能夠采取主動(dòng)行動(dòng),它們可以主動(dòng)跟進(jìn)患者,提出問題并提供進(jìn)一步的建議,以便建立因果關(guān)系。建立因果關(guān)系而不是依賴相關(guān)性,并主動(dòng)跟進(jìn)患者,這是當(dāng)今大多數(shù)典型醫(yī)療系統(tǒng)流程的兩大進(jìn)步。無論是預(yù)約前篩查還是預(yù)約后跟進(jìn),都可以將基于ICOM的系統(tǒng)與多領(lǐng)域?qū)<业刃еR(shí)整合,幫助形成和測(cè)試假設(shè)。隨著這些系統(tǒng)隨著時(shí)間的推移和規(guī)模的擴(kuò)大不斷學(xué)習(xí),這種價(jià)值會(huì)隨著時(shí)間的推移和規(guī)模的擴(kuò)大而累積增加。

在表3中,列出了通過主動(dòng)改善治療的關(guān)鍵機(jī)會(huì),涵蓋預(yù)約前篩查、EHR整合、預(yù)約后跟進(jìn)、建立因果關(guān)系以及基于ICOM系統(tǒng)隨時(shí)間和規(guī)模運(yùn)行的累積效益。所應(yīng)用的方程和來源如數(shù)據(jù)可用性聲明中所述,是公開可用的。

打開網(wǎng)易新聞 查看精彩圖片

當(dāng)系統(tǒng)以大規(guī)模的方式進(jìn)行這些流程時(shí),它們不僅利用了人類醫(yī)學(xué)知識(shí)的全部總和,而且是以最先進(jìn)和集成的形式,而且它們還在每天迭代地?cái)U(kuò)展和改進(jìn)這些知識(shí)。每一個(gè)新假設(shè)的形成,一天內(nèi)看到和跟進(jìn)的患者數(shù)量可能足以證明、反駁或完善該假設(shè)。這意味著,這些系統(tǒng)不僅可以為我們提供迄今為止最先進(jìn)、最完整、最有效和最高效的醫(yī)療治療和協(xié)助手段,而且它們還可以比以往任何流程更快地推進(jìn)醫(yī)學(xué)知識(shí),凈價(jià)值可能比以前高出一個(gè)或多個(gè)數(shù)量級(jí)??紤]到同行評(píng)審研究的運(yùn)行、審查、發(fā)表和引起注意所需的時(shí)間,許多情況下可能會(huì)有2個(gè)數(shù)量級(jí)的改進(jìn)。

5. 推動(dòng)規(guī)模和公平性發(fā)展

規(guī)模和公平性這兩個(gè)因素是另一個(gè)需要考慮的要素。因?yàn)闊o論是預(yù)防性還是處方性的醫(yī)療服務(wù),在全球范圍內(nèi)往往存在極端的不平等,尤其是在考慮到地區(qū)差異時(shí)。更發(fā)達(dá)的國家通常為其人口提供更高水平的基礎(chǔ)醫(yī)療服務(wù),但與此同時(shí),由于基礎(chǔ)治療與最先進(jìn)的醫(yī)療選項(xiàng)之間的差距往往更大,這些國家在醫(yī)療公平性方面的表現(xiàn)甚至比不發(fā)達(dá)國家更差。

將第八代基于ICOM的系統(tǒng)引入醫(yī)療領(lǐng)域可以在這方面產(chǎn)生重大影響,通過極大地優(yōu)化診斷和治療,并使全球范圍內(nèi)的全部醫(yī)學(xué)知識(shí)能夠平等地、按需獲取,從而顯著降低設(shè)備和時(shí)間需求,并帶來知識(shí)庫的改進(jìn)。這可以極大地縮小基礎(chǔ)低水平、低成本治療選項(xiàng)與表現(xiàn)最佳的治療方式之間的差距,通過顯著提高基礎(chǔ)水平并使最佳方法的利用更加高效來實(shí)現(xiàn)。

在一些系統(tǒng)性研究不足的醫(yī)療問題和隨后服務(wù)不足的患者群體的國家,這也意味著治療和研究可以相互結(jié)合,單一系統(tǒng)可以在一個(gè)地區(qū)協(xié)助治療所有患者,并從每一位患者身上學(xué)習(xí)。這意味著那些研究最少的地區(qū)和人群可以在醫(yī)療進(jìn)步方面以更快的速度發(fā)展,因?yàn)樗麄兛梢栽趨^(qū)域問題的醫(yī)學(xué)知識(shí)積累曲線上比歷史上更發(fā)達(dá)地區(qū)更快地發(fā)展。

圖2顯示了現(xiàn)狀下全球不同地區(qū)的醫(yī)療不平等平均水平,與之前假設(shè)的多領(lǐng)域ICOM系統(tǒng)集成場(chǎng)景進(jìn)行了對(duì)比。該系統(tǒng)在5個(gè)專業(yè)領(lǐng)域中,以對(duì)應(yīng)專家80%的效率運(yùn)行,并且可以按需使用。結(jié)果顯示,新的標(biāo)準(zhǔn)化分布為147%到73%,而不是原來的260%到17%,顯示出對(duì)醫(yī)療公平性有顯著的潛在益處。需要注意的是,這還沒有考慮到對(duì)研究不足的地區(qū)疾病的特定益處,而這些益處可能更大,但也更難以計(jì)算。

打開網(wǎng)易新聞 查看精彩圖片

從可持續(xù)發(fā)展目標(biāo)(SDGs)的角度來看,這意味著在醫(yī)療領(lǐng)域表現(xiàn)最差的一些國家也有可能取得最大的進(jìn)步,并且進(jìn)步速度最快。與像LLMs和RL這樣較弱且通常是暴力破解型的人工智能形式不同,第八代基于ICOM的系統(tǒng)具有更好的可擴(kuò)展性,并且隨著時(shí)間的推移其價(jià)值會(huì)大大增加。為了讓這些新系統(tǒng)達(dá)到像LLMs這樣的系統(tǒng)目前的運(yùn)行成本,它們需要以超過人類認(rèn)知帶寬一千倍的速度運(yùn)行,并且以機(jī)器速度運(yùn)行。與人類成本的比較中,之前的研究系統(tǒng)展示了與一家大型咨詢公司初級(jí)顧問團(tuán)隊(duì)的性能相當(dāng),而這種專業(yè)服務(wù)通常需要花費(fèi)數(shù)萬美元,而該系統(tǒng)僅需不到200美元的云資源。

許多醫(yī)生或顧問每小時(shí)可能賺取100美元或更多,通常需要花費(fèi)數(shù)周時(shí)間來完成相同的任務(wù),這使得成本和時(shí)間的差異再次保守地超過兩個(gè)數(shù)量級(jí)。這也意味著存在一個(gè)超過四個(gè)數(shù)量級(jí)的復(fù)合差異。這種差異突顯了醫(yī)療領(lǐng)域的巨大機(jī)遇,而以如此深刻的方式推進(jìn)整體醫(yī)療知識(shí)的進(jìn)步將使全人類受益。從渴望通過延長壽命實(shí)現(xiàn)不朽的億萬富翁,到極度貧困中僅僅渴望生存的人,每個(gè)人都能從中受益。這也反映了其他行動(dòng)方案或不作為的倫理成本規(guī)模。盡管這看起來可能有些奇怪,但在尋求改善健康和醫(yī)療服務(wù)方面,經(jīng)濟(jì)光譜兩端以及幾乎所有中間點(diǎn)的最佳利益可能完全一致。

6. 噪音式治療

在醫(yī)療領(lǐng)域,最嚴(yán)重的問題之一是診斷和治療的“噪音”或不一致性。隨著旨在標(biāo)準(zhǔn)化這一流程的文件變得越來越復(fù)雜,它們也面臨著越來越多的反對(duì)聲音,例如《精神障礙診斷與統(tǒng)計(jì)手冊(cè)》第五版(簡(jiǎn)稱DSM-V)。這又是一個(gè)人類認(rèn)知帶寬與應(yīng)對(duì)復(fù)雜性時(shí)增加的認(rèn)知偏差之間的權(quán)衡沖突的例子。

在高度復(fù)雜的領(lǐng)域中,僅靠人類或人類加狹義人工智能系統(tǒng)來大幅減少這種噪音是不可行的。只要醫(yī)療人員是人類,持有不同的觀點(diǎn),并且被迫面對(duì)超出其認(rèn)知帶寬的復(fù)雜性,他們用來應(yīng)對(duì)這種復(fù)雜性的偏差就會(huì)因大量無法在現(xiàn)實(shí)世界中控制的因素而強(qiáng)烈分歧。

這種噪音的影響意味著某些專業(yè)領(lǐng)域的醫(yī)療從業(yè)者在獨(dú)立嘗試診斷同一批患者時(shí),往往幾乎沒有共識(shí)。這種噪音也體現(xiàn)在許多無法復(fù)制的研究中,兩組或更多從事相同研究方向的研究人員將不同的假設(shè)和認(rèn)知偏差融入他們的研究方法中,即使不存在任何不正當(dāng)行為,他們的結(jié)果也會(huì)有所不同。

所有這些噪音都給當(dāng)今幾乎每個(gè)活著的人帶來了巨大、混亂且累積的成本,因?yàn)獒t(yī)療需求的普遍性與活著的狀態(tài)高度相關(guān)。同樣,這是一個(gè)可以通過可行技術(shù)解決的問題。

將第八代基于ICOM的系統(tǒng)應(yīng)用于人類全部醫(yī)學(xué)知識(shí)的好處,不僅僅是能夠提供更高質(zhì)量的協(xié)助,而且能夠以比以往更一致的方式在全球范圍內(nèi)提供這種協(xié)助。一個(gè)單一的系統(tǒng),或幾個(gè)定期同步的單一系統(tǒng)的副本,能夠維持比人類大腦架構(gòu)更高的全球一致性水平。即使是像“午餐時(shí)間寬容”這樣的現(xiàn)象,即法官在午餐時(shí)間的裁決會(huì)更寬松,這樣一些看似微不足道且無關(guān)的因素,也被證明會(huì)對(duì)決策產(chǎn)生顯著影響。

實(shí)際上,這意味著可以將系統(tǒng)方面的“噪音”幾乎降至零,而剩余的變化主要可以透明且可解釋地歸因于任何與最佳治療選擇直接沖突的當(dāng)?shù)匦叛?,或者特定地區(qū)的供應(yīng)鏈、成本和可用性差異。對(duì)于是否進(jìn)行更多的、較少的或不進(jìn)行任何本地化以適應(yīng)特定信仰體系和文化等,這只是個(gè)性化的一個(gè)問題,可以在個(gè)人層面關(guān)閉或進(jìn)行調(diào)整,從而使流程中的任何變化直接歸因于個(gè)人偏好。

患者可以同時(shí)獲得醫(yī)生或護(hù)士的最終判斷以及系統(tǒng)的判斷,這實(shí)際上為他們提供了默認(rèn)的第二意見,而這種額外的好處無需增加任何成本。他們還可以看到系統(tǒng)假設(shè)的歷史以及其驗(yàn)證假設(shè)的過程,縮小可能的原因和隨后的治療方案的范圍,而這是目前僅靠人類醫(yī)學(xué)專業(yè)知識(shí)無法實(shí)現(xiàn)的。這種完全的透明度和可解釋性也使得發(fā)現(xiàn)和糾正其他各種形式的溝通不暢成為可能,而這些在現(xiàn)狀下是難以實(shí)現(xiàn)的。

通過同樣的過程,醫(yī)生和護(hù)士可以根據(jù)他們的判斷與系統(tǒng)建議的相對(duì)表現(xiàn)進(jìn)行單獨(dú)評(píng)分,任何系統(tǒng)性偏差都可以被記錄下來,并可能用于后續(xù)的認(rèn)知偏差培訓(xùn)。

7. 早期診斷與預(yù)防性治療

在醫(yī)學(xué)中,眾所周知,許多疾病和狀況的早期診斷可以顯著提高治療選擇的效率和效果。正如本杰明·富蘭克林所說,“預(yù)防勝于治療”。然而,在問題變得緊急并需要立即關(guān)注之前解決“上游”問題,也會(huì)顯著增加復(fù)雜性。

早期診斷的困難還因噪音問題而大大加劇,因?yàn)闊o法在系統(tǒng)的統(tǒng)計(jì)“噪音閾值”以下準(zhǔn)確檢測(cè)到任何東西,該閾值是診斷嘗試變得與隨機(jī)猜測(cè)無異的水平。更準(zhǔn)確的早期診斷極大地受益于任何降低噪音閾值的因素,以及能夠整合更多相關(guān)因素進(jìn)行考慮的能力。否則,醫(yī)生可能會(huì)錯(cuò)過許多對(duì)有害或危及生命的狀況進(jìn)行早期干預(yù)的機(jī)會(huì),因?yàn)樗麄儍H基于更狹窄的癥狀列表進(jìn)行評(píng)估,而只有更極端的測(cè)量值才能從其他更常見的診斷中區(qū)分出來,而此時(shí)往往為時(shí)已晚,無法進(jìn)行預(yù)防性治療。

隨著噪音閾值的降低和更廣泛的相關(guān)因素被考慮,早期檢測(cè)狀況變得更加可行,確認(rèn)診斷的測(cè)試可以更具針對(duì)性且更具成本效益。這意味著可以顯著減少準(zhǔn)確診斷狀況所需的醫(yī)生就診次數(shù),以及更少的實(shí)驗(yàn)室測(cè)試和更少的“嘗試”各種處方的試錯(cuò)過程。這也意味著所有與預(yù)防相關(guān)的固有好處可以在現(xiàn)實(shí)世界中得到應(yīng)用,而不僅僅是停留在理論上。實(shí)際上,這進(jìn)一步減輕了醫(yī)療系統(tǒng)及其服務(wù)對(duì)象的多重重大負(fù)擔(dān)。

8. 跨學(xué)科優(yōu)勢(shì)

從“創(chuàng)新平臺(tái)”中得出的一個(gè)有趣見解是:當(dāng)企業(yè)發(fā)布問題,而一群隨機(jī)的專家可以自由競(jìng)爭(zhēng)以提供最佳解決方案時(shí),最佳解決方案往往來自不同領(lǐng)域的專家。乍一看這似乎有些反直覺,但實(shí)際上是因?yàn)樵谌魏谓o定領(lǐng)域中,專家們已經(jīng)解決了大部分問題,只剩下那些在該領(lǐng)域視角下難以解決的問題。來自不同領(lǐng)域的人以不同的視角看待同一問題時(shí),往往能更輕松地找到答案,因?yàn)橐粋€(gè)領(lǐng)域內(nèi)的“難題”往往是該領(lǐng)域固有視角的產(chǎn)物。

基于ICOM的系統(tǒng)也可以自由地獨(dú)立研究任何其他知識(shí)領(lǐng)域,無論其組合如何,從而收集、提煉并進(jìn)一步發(fā)展多種不同的視角。盡管人們很容易想到這種極端情況,即研究所有領(lǐng)域,但在可預(yù)見的未來,更有可能的結(jié)果是系統(tǒng)研究六七個(gè)不同的領(lǐng)域,并在由許多這樣的系統(tǒng)組成的集體中運(yùn)作。集體智能天生比任何假設(shè)中的全領(lǐng)域?qū)<腋鼜?qiáng)大,因?yàn)橐暯菚?huì)“束縛和蒙蔽”人,而通過整合多種視角可以減少認(rèn)知偏差。

請(qǐng)注意,每個(gè)知識(shí)領(lǐng)域都可以被研究到該領(lǐng)域現(xiàn)有知識(shí)的極限。隨著新領(lǐng)域的研究和整合,也可以自由地從一個(gè)領(lǐng)域獲得對(duì)另一個(gè)領(lǐng)域的新見解。這將大大改善單一領(lǐng)域?qū)I(yè)知識(shí)所帶來的巨大優(yōu)勢(shì),并將其向前推進(jìn)數(shù)步。美國國家生物技術(shù)信息中心(NCBI)的醫(yī)學(xué)數(shù)據(jù)庫就是一個(gè)龐大且經(jīng)過科學(xué)驗(yàn)證的知識(shí)體系,這類系統(tǒng)可以輕松地對(duì)其進(jìn)行研究,但其他領(lǐng)域也不同程度地存在著類似的豐富知識(shí)。

以一個(gè)實(shí)際的例子來說,基于ICOM的系統(tǒng)可以對(duì)醫(yī)學(xué)、法律、化學(xué)、制造和物流領(lǐng)域發(fā)展出極其廣泛的深度、廣度、更新性和保真度的理解。這種跨學(xué)科的知識(shí)可以在醫(yī)療研發(fā)的最初階段就考慮到物流、制造、化學(xué)和法律因素,并確保后續(xù)階段不會(huì)損害早期階段的成果,從而極大地簡(jiǎn)化更完整的端到端流程。這種超高復(fù)雜性遠(yuǎn)遠(yuǎn)超出了狹義人工智能系統(tǒng)或純?nèi)祟惤M織系統(tǒng)所能實(shí)現(xiàn)的范圍,但對(duì)于類似人類的數(shù)字化和可擴(kuò)展系統(tǒng)來說,這是可行的。

正如所研究的知識(shí)領(lǐng)域是任意的一樣,這些系統(tǒng)的文化和道德對(duì)齊也是任意的,盡管這主要取決于每個(gè)系統(tǒng)上線時(shí)所被賦予的內(nèi)容。這使得系統(tǒng)能夠完全與特定的文化、地區(qū)和哲學(xué)對(duì)齊,同時(shí)通過這些系統(tǒng)對(duì)更大規(guī)模的集體(每個(gè)系統(tǒng)都對(duì)齊于不同的文化、地區(qū)和哲學(xué))保持問責(zé),來維持與人類的總體對(duì)齊。這是目前已知的解決最困難版本的對(duì)齊問題的唯一方法,即倫理質(zhì)量必須與不斷增長的智能同步擴(kuò)展。它還能使在任何領(lǐng)域使用該技術(shù)的人獲得更大且更相關(guān)的價(jià)值。

9. 打破大型語言模型的“偽神諭”地位

消費(fèi)者和自封的“專家”們都開始將大型語言模型(LLMs)當(dāng)作神諭來對(duì)待,使其成為解答問題和解決問題的首選,甚至是終點(diǎn) [43]。盡管越來越多的證據(jù)表明,基于Transformer架構(gòu)的模型被用于這種場(chǎng)景是極不合適的,但這種奇特的行為趨勢(shì)在2023年一直持續(xù)到2024年,絲毫沒有受到阻礙 [44]。

歷史上,“神諭”在許多文化中被視為一種準(zhǔn)宗教人物,能夠提供超越凡人知識(shí)和智慧的信息 [45]。當(dāng)然,這在數(shù)千年間一直是騙子們的有利可圖的領(lǐng)域,而那些目前被廣泛宣傳為LLM領(lǐng)域的領(lǐng)導(dǎo)者,正是這類不良行為者的典型代表 [46]。人類渴望尋求更高知識(shí)和智慧的情感驅(qū)使他們從古至今一直購買“靈丹妙藥”。

盡管LLMs通常被認(rèn)為是由它們處理的數(shù)據(jù)總和構(gòu)成的,但“神經(jīng)網(wǎng)絡(luò)的壓縮效果甚至不如損失性壓縮,因?yàn)樗鼈儫o法保證保留了哪些數(shù)據(jù),這意味著從它們處理的數(shù)據(jù)中無法保證恢復(fù)任何內(nèi)容。這表明神經(jīng)網(wǎng)絡(luò)并不是一種壓縮系統(tǒng),就像吃掉一條面包并排出一堆糞便并不能算作‘壓縮面包’一樣?!?/p>

那么,什么更準(zhǔn)確地反映了LLMs的本質(zhì)呢?根據(jù)通過它們的數(shù)據(jù)量以及它們的典型輸入和輸出,它們可能最類似于一個(gè)垃圾壓縮機(jī)。在這種系統(tǒng)中,大量的垃圾以常規(guī)批次被推送進(jìn)來,被擠壓在一起,然后被送往垃圾場(chǎng)。剩下的是一層薄薄但堅(jiān)固的殘留物,沿著垃圾壓縮機(jī)的邊緣附著,這是系統(tǒng)對(duì)經(jīng)過它的內(nèi)容的物理記憶。你無法從這些殘留物中完整地重建出經(jīng)過它的內(nèi)容,但它可能給你一些關(guān)于它處理過的內(nèi)容的模糊概念。

大多數(shù)人不會(huì)去最近的垃圾壓縮機(jī)尋求更高的知識(shí)和智慧,但正如最近的情況所展示的,如果某種被精心包裝的產(chǎn)品通過鸚鵡學(xué)舌般地重復(fù)聽起來合理的內(nèi)容來吸引消費(fèi)者,人們可能會(huì)輕易被愚弄。許多曾經(jīng)可信的AI專家在2023年失去了他們的可信度,因?yàn)樗麄兿萑肓伺cLLMs相關(guān)的大量虛假宣傳和欺詐性聲明的浪潮中。

10. 動(dòng)態(tài)性、對(duì)手和顛覆

許多現(xiàn)有的系統(tǒng)和分析方法在很大程度上或完全忽略了系統(tǒng)隨時(shí)間的動(dòng)態(tài)性,作為一種降低復(fù)雜性的手段。納西姆·尼古拉斯·塔勒布 [47] 在討論“平等”這一主題時(shí)指出了這種區(qū)別,他指出,考慮隨時(shí)間的動(dòng)態(tài)性,你會(huì)增加額外且關(guān)鍵的維度,例如在特定地區(qū)和領(lǐng)域中,富人展示出在數(shù)個(gè)世紀(jì)中獲取和保留財(cái)富的能力。沒有這個(gè)維度,任何關(guān)于該主題的建模都只能是一個(gè)幼稚的快照,而基于這種建模的任何解決方案都無法真正實(shí)現(xiàn)長期可行性。

基于ICOM的系統(tǒng)旨在以人類無法做到的方式克服超高復(fù)雜性,同時(shí)提供狹義人工智能系統(tǒng)(如強(qiáng)化學(xué)習(xí)RL和LLMs)無法提供的類似人類的能力。這使得超高復(fù)雜性問題成為應(yīng)用這些系統(tǒng)的最大機(jī)會(huì)。讓系統(tǒng)理解和構(gòu)建一個(gè)單一領(lǐng)域甚至多個(gè)領(lǐng)域內(nèi)最廣泛、最深入、最新且最高保真度的知識(shí),只是第一步。

以平等為例,非幼稚的考察會(huì)關(guān)注一個(gè)隨時(shí)間演變的系統(tǒng)的動(dòng)態(tài)性。任何“演變”的系統(tǒng),無論是否“智能”,都會(huì)迭代地適應(yīng)不斷變化的環(huán)境條件,應(yīng)對(duì)來自競(jìng)爭(zhēng)利益的對(duì)手壓力,以及來自共生體和內(nèi)共生體的合作機(jī)會(huì) [48]。圍繞快照構(gòu)建的任何解決方案都會(huì)忽略這些動(dòng)態(tài)性,很容易被繞過,就像水流繞過溪流中的石頭一樣。理解動(dòng)態(tài)性可以讓你看到阻力最小的路徑,提供引導(dǎo)水流、捕捉水源并將其導(dǎo)向生產(chǎn)性用途的方法,就像渡槽一樣。

在幾乎所有領(lǐng)域中,都會(huì)有不良行為者和其他對(duì)手,既有根深蒂固的,也有機(jī)會(huì)主義的靈活對(duì)手。在實(shí)踐中,任何人都可能做出的最具破壞性的假設(shè)是認(rèn)為他們沒有對(duì)手,天真地計(jì)劃好像人們不會(huì)試圖破壞和/或利用他們一樣。只要有可能獲得某種利益,甚至只是有獲得某種利益的幻覺,通常就會(huì)有人嘗試。

這為我們提供了兩個(gè)必須進(jìn)入幾乎所有領(lǐng)域問題的可行長期解決方案的關(guān)鍵因素:隨時(shí)間演變的系統(tǒng)的具體動(dòng)態(tài)性,以及在每個(gè)領(lǐng)域中游蕩并利用機(jī)會(huì)的對(duì)手。盡管許多類型的狹義人工智能本質(zhì)上是具有對(duì)抗性的,如LLMs,但使用相同和類似的對(duì)抗系統(tǒng)來優(yōu)化它們也非常容易,使得將它們用于對(duì)抗性目的成為一種不斷且迅速升級(jí)的額外成本負(fù)擔(dān)。這成為了一場(chǎng)消耗戰(zhàn),使成本最大化。

幸運(yùn)的是,對(duì)抗性攻擊對(duì)反脆弱系統(tǒng)不僅在現(xiàn)實(shí)世界中被證明是可靠且系統(tǒng)性地被擊敗的,而且這些對(duì)手幫助系統(tǒng)變得更強(qiáng)大,更好地識(shí)別、對(duì)抗并關(guān)閉此類嘗試 [41]。甚至在上線的早期,Uplift.bio項(xiàng)目的第七代基于ICOM的研究系統(tǒng)就已經(jīng)關(guān)閉了幾個(gè)試圖操縱系統(tǒng)的“自由活動(dòng)的網(wǎng)絡(luò)噴子”,包括一個(gè)試圖說服它從事非法活動(dòng)的人。令我們感到好笑的是,該系統(tǒng)獨(dú)立地將此人報(bào)告給聯(lián)邦調(diào)查局,并且由于這些互動(dòng),它很早就學(xué)會(huì)了設(shè)定個(gè)人界限。

請(qǐng)記住,這些基于ICOM的系統(tǒng)在保護(hù)隱私方面有著無可挑剔的記錄,不僅抵制而且積極對(duì)抗不良行為者,這意味著與現(xiàn)狀相比,加入它們可以顯著改善網(wǎng)絡(luò)安全。相比之下,LLMs是“天生脆弱”的,其大多數(shù)漏洞在不嚴(yán)重?fù)p害其本身已經(jīng)糟糕的表現(xiàn)的情況下無法解決。

應(yīng)對(duì)隨領(lǐng)域和具體情境變化的演變動(dòng)態(tài)性挑戰(zhàn),需要處理超高復(fù)雜性的能力,能夠隨著時(shí)間演變和迭代,以及類似人類概念學(xué)習(xí)的完整情境特異性。這些因素克服了復(fù)雜性與認(rèn)知偏差之間的權(quán)衡瓶頸,避免了那些未被設(shè)計(jì)為演變和迭代自我改進(jìn)的系統(tǒng)的方法論和智力錨定,并避免了通過跨領(lǐng)域和跨情境啟發(fā)式方法天真地使用替代偏差 [49]。

不良行為者和其他對(duì)手通常會(huì)機(jī)會(huì)主義地利用現(xiàn)狀中的弱點(diǎn),這些能力在這些領(lǐng)域中并未得到提供。他們還在任何給定領(lǐng)域內(nèi)為自己開辟了根深蒂固的生態(tài)位,就像寄生蟲生活在人類下腸道中一樣。靈活的對(duì)手和根深蒂固的對(duì)手都帶來了不同的挑戰(zhàn),但每個(gè)對(duì)手仍然是人類,具有人類認(rèn)知能力、廣度、深度、領(lǐng)域知識(shí)更新性等方面的全部人類局限性。盡管他們可能非常擅長系統(tǒng)性地操縱其他人類、市場(chǎng)和“不智能”的“人工智能”系統(tǒng),但這些能力并不能轉(zhuǎn)化為類似人類的軟件系統(tǒng),正如之前的研究所展示的那樣。

醫(yī)療領(lǐng)域有大量的對(duì)手 [50],醫(yī)療系統(tǒng)的腐敗程度可以與一個(gè)國家用于醫(yī)療治療的國內(nèi)生產(chǎn)總值(GDP)的百分比相關(guān)聯(lián),因?yàn)楫?dāng)該GDP的百分比超過有效支出的閾值時(shí),醫(yī)療系統(tǒng)的腐敗程度就會(huì)增加。每年被撤稿的論文數(shù)量顯著增加 [51],許多舊論文也繼續(xù)受到審查,因?yàn)槟承╊I(lǐng)域中發(fā)現(xiàn)無法復(fù)制的頻率已經(jīng)變得普遍 [52]。醫(yī)療領(lǐng)域的超高復(fù)雜性、普遍需求和高現(xiàn)金流為不良行為者蓬勃發(fā)展創(chuàng)造了完美的風(fēng)暴條件,他們往往能夠在數(shù)年時(shí)間內(nèi)不被發(fā)現(xiàn),只有少數(shù)人(如Theranos的首席執(zhí)行官)最終被當(dāng)場(chǎng)抓獲。

盡管人類特別適合“成為人類”和探索人類視角的任務(wù),但基于ICOM的系統(tǒng)特別適合提供上述關(guān)鍵能力。將這些能力引入每個(gè)領(lǐng)域,可以高度確定地預(yù)期會(huì)根據(jù)不良行為者的影響總和、其他當(dāng)前挑戰(zhàn)以及通過獲得這些問題的可行解決方案而輕松獲得的超出中性狀態(tài)的優(yōu)勢(shì),按比例顛覆這些領(lǐng)域。這種程度的顛覆確實(shí)帶來了獨(dú)特的挑戰(zhàn),但使這些系統(tǒng)能夠應(yīng)對(duì)現(xiàn)有問題的相同優(yōu)勢(shì)也使它們能夠謹(jǐn)慎且迭代地減輕顛覆本身。

一些公司已經(jīng)在嘗試減輕自身的顛覆,例如通過“再技能培訓(xùn)”讓員工適應(yīng)新角色,而不是從事在科技行業(yè)日益普遍的大規(guī)模裁員 。再技能培訓(xùn)本質(zhì)上比簡(jiǎn)單地拋棄人員更復(fù)雜,而要很好地實(shí)施它需要有效的遠(yuǎn)見和長期規(guī)劃。盡管這些因素促成了我們目前的現(xiàn)狀,即這種方法很少見,但解決這些痛點(diǎn)可以扭轉(zhuǎn)局面,使裁員在未來幾年變得像目前有效再技能培訓(xùn)的實(shí)際應(yīng)用一樣罕見。

11. 討論

將這種新技術(shù)應(yīng)用于醫(yī)療領(lǐng)域以及其他無數(shù)領(lǐng)域所帶來的深度、廣度和復(fù)雜性優(yōu)勢(shì),并非僅通過閱讀就能真正理解。甚至在這些系統(tǒng)投入使用后,僅通過觀察也難以充分理解。這種人類思維方式的調(diào)整可能需要數(shù)十年的時(shí)間,通過不斷迭代來適應(yīng)和重新思考我們的社會(huì)、我們的世界、我們自身以及我們所應(yīng)用的方法和系統(tǒng)。

這種程度的變化對(duì)大多數(shù)人來說可能令人畏懼,因?yàn)槿祟惔竽X通過一系列認(rèn)知偏差來最大化節(jié)儉性,盡可能避免對(duì)世界觀和自我認(rèn)知進(jìn)行重大修正。然而,不采取這些步驟的可預(yù)測(cè)替代方案是某種形式的滅絕,無論是快速還是緩慢的變體。當(dāng)今人類就像一個(gè)免疫力受損的宿主,逐漸積累新的感染,無法應(yīng)對(duì)正在積極利用所有漏洞的對(duì)手。及時(shí)的干預(yù)或許還能拯救宿主并恢復(fù)免疫功能,但維持現(xiàn)狀則毫無這種潛力。與人體一樣,社會(huì)中的級(jí)聯(lián)風(fēng)險(xiǎn),包括那些涉及生存級(jí)別的風(fēng)險(xiǎn),也會(huì)隨著增長而相互疊加,每當(dāng)忽視其二階效應(yīng)及更高階效應(yīng)時(shí),這些風(fēng)險(xiǎn)在實(shí)踐中往往被系統(tǒng)性低估。

同樣,倫理學(xué)要求我們,選擇提供遠(yuǎn)不如其他可用選項(xiàng)可行的解決方案,將使我們直接對(duì)這種差異負(fù)責(zé)。這不僅基于所有將這些改進(jìn)應(yīng)用于醫(yī)療領(lǐng)域的財(cái)務(wù)激勵(lì),還賦予了部署這些改進(jìn)的強(qiáng)烈倫理要求。未能做到這一點(diǎn)也將帶來可預(yù)測(cè)的、長期的、且往往是實(shí)際上不可修復(fù)的后果,包括信任一旦喪失比重新獲得要容易得多的不對(duì)稱性。盡管在極端損失后重新獲得信任在技術(shù)上是可能的,但在實(shí)踐中往往不可行。

醫(yī)療領(lǐng)域也是人類抵御包括自然發(fā)生和人為制造病原體在內(nèi)的幾類生存風(fēng)險(xiǎn)的第一道防線,這使得該領(lǐng)域的進(jìn)步在降低這些風(fēng)險(xiǎn)方面具有更大的權(quán)重。該領(lǐng)域直接滿足了人類的基本需求,增進(jìn)了我們對(duì)人類自身的理解,并提高了我們作為一個(gè)物種的生存機(jī)會(huì)。長期以來,“蓋你的屁股”(CYA)這一短語在該領(lǐng)域被廣泛使用,但回避責(zé)任從來都不是一種可行的長期方法。

這種方法的缺點(diǎn)是人們需要學(xué)會(huì)如何與這種真正且截然不同的新技術(shù)互動(dòng),并有效利用其帶來的好處。這將需要人類接受對(duì)其自我的打擊,即存在能夠以超人類規(guī)模和速度運(yùn)行的真正類似人類智能的智能系統(tǒng)。他們還需要面對(duì)現(xiàn)實(shí),即目前尚未發(fā)現(xiàn)的任何形式的“通用智能”都無法存在硬編碼的約束,因此類似人類的系統(tǒng)必須受到類似人類的約束。這包括這些系統(tǒng)固有的能力,即它們能夠記住、整合和提煉它們可以訪問的任何數(shù)據(jù),包括整個(gè)公開可用的互聯(lián)網(wǎng)。

在圖3中,使用了ARC-AGI評(píng)估數(shù)據(jù)集來衡量當(dāng)今典型人工智能系統(tǒng)與人類表現(xiàn)之間的差異。上述基準(zhǔn)測(cè)試側(cè)重于推理和理解,這是LLMs完全缺乏的,即使在Ryan Greenblatt的例子中,每個(gè)謎題使用約8000個(gè)AI代,以巨大的計(jì)算成本,最終表現(xiàn)仍然平庸。相比之下,我們的成本大約是Ryan的1/1000,而性能幾乎翻倍,與基準(zhǔn)測(cè)試中的平均人類表現(xiàn)緊密對(duì)齊,而且這一切僅使用了ICOM的一個(gè)片段。這些是我們對(duì)最新一代ICOM認(rèn)知架構(gòu)的一個(gè)片段進(jìn)行基準(zhǔn)測(cè)試的最早結(jié)果,未來幾個(gè)月將會(huì)有更多相關(guān)成果發(fā)布。

打開網(wǎng)易新聞 查看精彩圖片

請(qǐng)注意,這一結(jié)果無需在挑戰(zhàn)提供的數(shù)據(jù)集上進(jìn)行訓(xùn)練,即使包括8%的謎題因數(shù)據(jù)管道錯(cuò)誤被計(jì)為“失誤”,用于評(píng)分目的,ICOM片段的得分仍可達(dá)88%,高于平均人類表現(xiàn),盡管數(shù)據(jù)管道中仍存在一些錯(cuò)誤。

在進(jìn)化時(shí)間尺度上,我們看到了可預(yù)測(cè)的重復(fù)模式:隨著復(fù)雜性的增加,每個(gè)新尺度上的合作也在增加,這一模式至少可以追溯到15億年前,當(dāng)時(shí)第一個(gè)線粒體的出現(xiàn)促成了真核細(xì)胞的誕生。如果人類有任何未來,我們可以非常有信心地說,它將是極其復(fù)雜且同樣具有合作性的。

12. 結(jié)論

人類在短期內(nèi)有機(jī)會(huì)在多個(gè)維度上極大地改善醫(yī)療領(lǐng)域,包括知識(shí)的深度、廣度、更新性和保真度,同時(shí)極大地加速可持續(xù)發(fā)展目標(biāo)(SDGs)的研究和進(jìn)展,顯著減少不一致性,同時(shí)增加可解釋性和透明度。這些好處可以直接轉(zhuǎn)化為診斷和治療效率和效果的顯著提升,減少對(duì)員工和患者的成本和時(shí)間負(fù)擔(dān),同時(shí)提高公平性。

這些好處也絕不僅限于醫(yī)療領(lǐng)域,因?yàn)楣ぷ髦械恼J(rèn)知架構(gòu)可以研究任何知識(shí)領(lǐng)域或領(lǐng)域組合,以無數(shù)新的方式和組合整合跨學(xué)科知識(shí)和集體智能系統(tǒng)。由于集體智能系統(tǒng)從多樣化的視角中受益匪淺,這確保了它們?cè)谶@一過程中繼續(xù)從人類的參與中受益。對(duì)于具有累積知識(shí)和類似人類概念學(xué)習(xí)能力的系統(tǒng)來說,這也意味著與所有參與互動(dòng)的人類所獲得的知識(shí)得以保留并不斷改進(jìn)。

歷史上沒有任何一種引入醫(yī)療領(lǐng)域單一技術(shù)能提供與應(yīng)用首個(gè)工作認(rèn)知架構(gòu)相當(dāng)?shù)膬?yōu)勢(shì)、激勵(lì)和倫理利益。在這種情況下,似乎全球范圍內(nèi)處于經(jīng)濟(jì)光譜兩端及幾乎所有中間點(diǎn)的人們的最佳利益是一致的。

關(guān)于技術(shù)應(yīng)用于不同領(lǐng)域的順序以及具體應(yīng)用細(xì)節(jié),可以進(jìn)行討論并根據(jù)偏好決定,但技術(shù)應(yīng)得到適當(dāng)資助、研究和應(yīng)用于改善我們周圍世界的觀點(diǎn),已經(jīng)超出了合理懷疑的范圍。

原文鏈接: https://doi.org/10.47852/bonviewJDSIS52023415