
題圖|視覺中國(guó)
DeepSeek-R1蔓延速度之快,讓偉大的前輩ChatGPT都成了“老爺車”。
DeepSeek-R1憑借其特有的"認(rèn)知預(yù)判"架構(gòu),在2025年率先實(shí)現(xiàn)了生成質(zhì)量與推理速度的平衡,成為有史以來(lái)增速最快的大模型。
而且單代AI技術(shù)整體的“領(lǐng)先有效期”越來(lái)越短,對(duì)企業(yè)形成愈加頻繁地強(qiáng)烈沖擊。
在這種形勢(shì)下,一方面企業(yè)要持續(xù)跟蹤最新的技術(shù),另一方面同時(shí)還要保證自己AI應(yīng)用落地的效果——這已經(jīng)成為企業(yè)在AI上的巨大挑戰(zhàn)。
DeepSeek-R1強(qiáng),讓企業(yè)更焦慮
DeepSeek-R1比較容易產(chǎn)生“幻覺”,恰恰是源于其關(guān)鍵創(chuàng)新:正式回答前的深度思考。
這個(gè)類似于人類在回答復(fù)雜問題前,會(huì)先在腦海中梳理思路,內(nèi)容更有條理性和邏輯性。因其生成文字的能力足夠強(qiáng),邏輯足夠強(qiáng)大,這些幻想出來(lái)的“假話”往往還非常難分辨。
要么讓它負(fù)責(zé)前期思考,提供解決問題的框架;要么在完成資料搜集后,利用它強(qiáng)大的語(yǔ)言能力進(jìn)行內(nèi)容整合輸出。最終結(jié)合部分其他大模型的成果,實(shí)現(xiàn)總體效果的最佳化。
對(duì)需要產(chǎn)生商業(yè)價(jià)值的企業(yè)級(jí)生成式AI應(yīng)用來(lái)說(shuō),這完全不可接受。這就是生成式AI著名的“不可能三角”:準(zhǔn)確、性能、成本。

這三方面的綜合要求,最終轉(zhuǎn)化為了AI應(yīng)用搭建、知識(shí)儲(chǔ)備、模型訓(xùn)練與部署等環(huán)節(jié)中的復(fù)雜挑戰(zhàn)。即使那些已完成數(shù)字化轉(zhuǎn)型的企業(yè),也常在這些環(huán)節(jié)中偏離正軌,最終導(dǎo)致投入大量資金卻未能獲得預(yù)期效果。
“解藥”,藏在誰(shuí)手里?
答案其實(shí)很明確,在云廠商手里。
今天凌晨,亞馬遜云科技宣布在Amazon Bedrock平臺(tái)上推出全托管、無(wú)服務(wù)器的DeepSeek-R1模型,是首個(gè)提供DeepSeek-R1作為全托管、正式商用模型的海外云廠商。所以,對(duì)于出海企業(yè)而言,DeepSeek on Bedrock是一個(gè)絕佳的選擇。

DeepSeek-R1作為Amazon Bedrock上首個(gè)完全托管的中國(guó)大模型,在今年1月底的部署版DeepSeek-R1上線之后就獲得了企業(yè)客戶的好評(píng),數(shù)千用戶已經(jīng)Amazon Bedrock的自定義模型導(dǎo)入功能進(jìn)行了部署。
此次更新的完全托管版相比之前的部署版,能夠進(jìn)一步使用Amazon Bedrock上所有功能,包括模型蒸餾、安全防護(hù)、數(shù)據(jù)加密、模型評(píng)估以及開箱即用的工具。
亞馬遜云科技這一次的更新,從事實(shí)上證明了云計(jì)算廠商在AI大模型時(shí)代依舊具有明確的競(jìng)爭(zhēng)優(yōu)勢(shì):
1、更準(zhǔn)確——云端大模型商店,匯聚全球最領(lǐng)先的AI大模型,供企業(yè)快速調(diào)用;企業(yè)數(shù)據(jù)全面防護(hù),驅(qū)動(dòng)大模型訓(xùn)練和運(yùn)轉(zhuǎn); 2、更強(qiáng)性能——云原生架構(gòu)方便多種模型和海量Agent協(xié)作;大規(guī)模GPU計(jì)算基礎(chǔ)設(shè)施,隨時(shí)調(diào)用; 3、更低成本——減少企業(yè)自身使用大模型、蒸餾小模型的工作量;靈活調(diào)用的計(jì)算資源,可以從根本上減少計(jì)算花費(fèi)。
絕大多數(shù)企業(yè)無(wú)法擁有機(jī)器學(xué)習(xí)專家、數(shù)據(jù)科學(xué)家和語(yǔ)言模型專家,人才成本、人才累積都無(wú)法承受。
云計(jì)算廠商,則可以在人才和基礎(chǔ)設(shè)施方面進(jìn)行更積極的投入,更好、更快地挖掘技術(shù)潛力。同時(shí)還能積極推進(jìn)與全球多家最領(lǐng)先AI創(chuàng)業(yè)公司合作。生態(tài)化的合作方式,讓眾多客戶企業(yè)能夠享受到全球最領(lǐng)先的AI人才、AI創(chuàng)業(yè)公司的技術(shù)成果。

亞馬遜云科技通過與Anthropic、DeepSeek、Cohere等頭部AI創(chuàng)業(yè)公司深度合作,讓Amazon Bedrock上可選基礎(chǔ)大模型來(lái)到180多款,其中50款可以云原生部署,比如Claude3.7 Sonnet、DeepSeek-R1、Llama 3.3、Nova系列模型、Mistral Large等。
相比大模型的“有無(wú)問題”,云計(jì)算廠商還是有更進(jìn)幾步的思考:
一、多模型的選擇和部署
根據(jù)國(guó)際知名咨詢機(jī)構(gòu)Gartner的最新預(yù)測(cè):因?yàn)閱我荒P蜔o(wú)法同時(shí)滿足企業(yè)的所有功能性和非功能性要求,所以到2027年,中國(guó)80%的企業(yè)將使用多模型生成式人工智能策略來(lái)實(shí)現(xiàn)多樣化的模型功能,來(lái)獲得成本效益。
但想要完成復(fù)雜的多模型部署與應(yīng)用協(xié)調(diào)并非易事,在打造專用模型的過程中,企業(yè)還很可能因?yàn)樽陨聿]有足夠龐大且高質(zhì)量的數(shù)據(jù)集來(lái)訓(xùn)練和優(yōu)化,導(dǎo)致效果不佳。最終出現(xiàn)落地進(jìn)程比不過技術(shù)快速迭代的速度,導(dǎo)致“技術(shù)落地即過時(shí)?!?/p>
Amazon Bedrock的多種大模型的同平臺(tái)、同Marketplace搭載,就為企業(yè)多模型組合使用創(chuàng)造了便利。企業(yè)完全可以根據(jù)自己的需求特點(diǎn),實(shí)現(xiàn)云上多模型策略:根據(jù)自己的具體場(chǎng)景需求,把多個(gè)大模型,按照“高級(jí)的高性能安全模型、中級(jí)的平衡型模型、Good-Enough便宜大碗好用模型”雇傭一組不同學(xué)歷和資歷的AI員工,兼顧場(chǎng)景、性能、準(zhǔn)確和成本。
例如亞馬遜云科技自己的Nova模型,就是典型的“便宜大碗安全好用型”,本身就涵蓋了多個(gè)版本,在各類基準(zhǔn)測(cè)試中表現(xiàn)持平來(lái)自于Google的Gemini 1.5 Flash,同時(shí)比后者還有更快的輸出速度和性價(jià)比,適用于企業(yè)客服、內(nèi)容生成、簡(jiǎn)單數(shù)據(jù)分析、企業(yè)內(nèi)部自動(dòng)化等場(chǎng)景。就非常適合當(dāng)做“Good-Enough”模型,企業(yè)可以拿它與Claude 3.7 Sonnect、DeepSeek-R1這樣的強(qiáng)模型組合,形成高低搭配。
二、能落地、上生產(chǎn),才是好模型
企業(yè)客戶需要趁手的開發(fā)平臺(tái)、工具、功能,實(shí)現(xiàn)真正的從技術(shù)落地到上生產(chǎn)的老大難問題。
Amazon SageMaker AI,讓用戶可以在集成式開發(fā)環(huán)境高效地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。Amazon Bedrock自帶防護(hù)機(jī)制中的“自動(dòng)推理檢查”功能,則可以從根源上盡可能消除大模型運(yùn)行過程中的“幻覺”問題。
云計(jì)算結(jié)合大模型的解決方案,正在全面推動(dòng)云計(jì)算再次成為企業(yè)IT基礎(chǔ)設(shè)施的最佳選擇。

在知名咨詢機(jī)構(gòu)PWC的一份關(guān)于領(lǐng)先企業(yè)在云計(jì)算和AI領(lǐng)域的投入調(diào)研中,有92%的行業(yè)領(lǐng)先企業(yè)都正在計(jì)劃增加自己的云預(yù)算,其中63%更是將云預(yù)算的增長(zhǎng)提升了6%以上(遠(yuǎn)高于通貨膨脹率)。
越來(lái)越多的企業(yè)正在通過AI驅(qū)動(dòng)的云架構(gòu)加速數(shù)據(jù)現(xiàn)代化,將IT能力與AI緊密結(jié)合,從而在行業(yè)中獲得領(lǐng)先地位。
亞馬遜云科技,企業(yè)AI時(shí)代的“僚機(jī)”
亞馬遜云科技CEO Matt Garman在一次采訪中明確指出AI時(shí)代云計(jì)算廠商的核心任務(wù)——持續(xù)走在企業(yè)前列,幫助客戶捕捉關(guān)鍵選擇。
他以兩個(gè)例子來(lái)說(shuō)明這一觀點(diǎn):第一,為用戶提供最先進(jìn)的技術(shù)和產(chǎn)品,例如推理能力更強(qiáng)的DeepSeek-R1大模型;第二,打造有競(jìng)爭(zhēng)力的AI計(jì)算基礎(chǔ),例如亞馬遜云科技專門為人工智能訓(xùn)練和推理設(shè)計(jì)的Tranium2人工智能芯片。
Garman特別強(qiáng)調(diào),云計(jì)算廠商并非像其他公司一樣急于推出聊天機(jī)器人,而是基于客戶需求,打造一個(gè)聚合平臺(tái),提供多種大模型和各環(huán)節(jié)工具,幫助客戶將新技術(shù)真正應(yīng)用于業(yè)務(wù),讓AI成為企業(yè)的關(guān)鍵競(jìng)爭(zhēng)優(yōu)勢(shì)。
亞馬遜云科技的實(shí)踐與傳統(tǒng)云計(jì)算時(shí)代并無(wú)本質(zhì)不同——始終走在技術(shù)探索的前沿,在掌握新技術(shù)后,將成果反饋給客戶。
為了確保領(lǐng)先,亞馬遜還在不斷增加投入。根據(jù)第三方研究機(jī)構(gòu)的統(tǒng)計(jì),亞馬遜繼續(xù)在基礎(chǔ)設(shè)施的支出上領(lǐng)銜全球云廠商,2024年AI基礎(chǔ)設(shè)施投資更是推動(dòng)了資本支出的大幅增加。亞馬遜CEO Andy Jassy在此前的第四季度財(cái)報(bào)會(huì)上專門指出:亞馬遜第四季度263億美元資本支出的"絕大部分"用于亞馬遜云科技的AI投資。

"開放的多贏邏輯"、"保持技術(shù)實(shí)力的絕對(duì)優(yōu)勢(shì)"、"只盯著客戶的需求"——這是亞馬遜云科技在生成式AI時(shí)代走向新高度背后的邏輯。
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系 hezuo@huxiu.com
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4062550.html
熱門跟貼