2012年,亞馬遜云科技舉辦首屆re:Invent大會。當(dāng)時,許多人還不知云為何物。

2024年,re:Invent大會步入第13個年頭,云已無處不在,成為事實(shí)上的基礎(chǔ)設(shè)施。

13年間,亞馬遜云科技引領(lǐng)了云計(jì)算的發(fā)展,re:Invent大會則成為了業(yè)界風(fēng)向標(biāo)。

01

re:Invent 2024來襲,AI吸睛,數(shù)據(jù)庫更亮眼

美國當(dāng)?shù)貢r間2024年12月2日,2024亞馬遜云科技re:Invent全球大會在拉斯維加斯正式拉開帷幕,4天時間,亞馬遜云科技全方位闡釋了他們眼中的云未來,而AI作為關(guān)鍵詞,貫穿整個大會。

據(jù)悉,本屆大會吸引了線上線下46萬人觀看,再創(chuàng)歷史新高。亞馬遜云科技究竟有什么魔力,能持續(xù)這么多年把如此多愛好者、從業(yè)者聚集在re:Invent這樣一個平臺相互學(xué)習(xí)。

在我看來,亞馬遜云科技就像一個能量體,13年來通過re:Invent這樣一個平臺一直不斷對外輸出著其對行業(yè)發(fā)展的理解,分享著最前沿的技術(shù)和行業(yè)實(shí)踐,而社區(qū)、愛好者、從業(yè)者總能在這里得到一些啟發(fā)。

此次大會上,亞馬遜云科技就全面展現(xiàn)了其對AI的理解和布局,并發(fā)布了AI全家桶。其中,基礎(chǔ)架構(gòu)層:計(jì)算,存儲,數(shù)據(jù)庫全方位革新,推出全新計(jì)算實(shí)例、存儲服務(wù)和數(shù)據(jù)庫新功能;中間層,Amazon Nova發(fā)布6款大模型,預(yù)告2款大模型,同時Amazon Bedrock迎來三大重要更新;應(yīng)用層,Amazon Q developer、Amazon Q Business、Amazon SageMaker均實(shí)現(xiàn)全方位提升。

這其中尤為值得關(guān)注的是數(shù)據(jù)庫新功能的發(fā)布,因?yàn)橄啾绕渌奶嵘?,此次亞馬遜云科技數(shù)據(jù)庫功能的革新堪稱劃時代。

02

CAP,困數(shù)據(jù)庫發(fā)展久已

眾所周知,數(shù)據(jù)庫行業(yè)一直存在一個悖論,即CAP原則,又稱CAP定理,指的是在一個分布式系統(tǒng)中,一致性(Consistency)、可用性(Availability)、分區(qū)容錯性(Partition tolerance),這三個要素最多只能同時實(shí)現(xiàn)兩點(diǎn),不可能三者兼顧。

CAP原則帶來的后果是什么呢?

要么AP,要么CP,要么AC,但是不存在CAP。CAP原則使得用戶在進(jìn)行分布式架構(gòu)設(shè)計(jì)時,必須做出取舍。至于如何取舍,則需要根據(jù)業(yè)務(wù)來抉擇。比如金融系統(tǒng)肯定要優(yōu)先保證數(shù)據(jù)一致性;而社交媒體則考慮優(yōu)先保證分區(qū)容錯性。

都很好理解,金融行業(yè)肯定優(yōu)先考慮數(shù)字一致性,畢竟錢數(shù)對不上是大問題;社交媒體則會優(yōu)先考慮系統(tǒng)可用性,點(diǎn)贊數(shù)量不對的重要性遠(yuǎn)不及用戶登陸不了。

也正是因?yàn)槿绱?,盡管分布式系統(tǒng)已經(jīng)發(fā)展了很多年,但金融相關(guān)行業(yè)的系統(tǒng)遷移始終排在所有行業(yè)之后,很多時候金融行業(yè)就是在觀望,等待更好的解決方案誕生。

現(xiàn)在,更好的分布式數(shù)據(jù)庫解決方案來了。

此次re:Invent大會上,亞馬遜云科技正式宣布推出Amazon Aurora DSQL和Amazon DynamoDB global tables新功能,以滿足一些特殊工作負(fù)載對跨區(qū)域運(yùn)行、強(qiáng)一致性、低延遲、高可用性的嚴(yán)苛需求。目前,兩個數(shù)據(jù)庫的跨區(qū)域強(qiáng)一致性功能已推出預(yù)覽版。

打開網(wǎng)易新聞 查看精彩圖片

03

亞馬遜云科技有什么金剛鉆,能捅破CAP數(shù)十年的籠罩?

CAP原則存在由來已久,亞馬遜云科技是如何捅破CAP陰影的?在我看來,最重要的是亞馬遜云科技跳出了原來的數(shù)據(jù)庫運(yùn)行思維。在這兩天的主題演講中,無論是亞馬遜云科技高級副總裁Peter DeSantis,還是6月新上任的CEO Matt Garman,都不只一次提到亞馬遜云科技的創(chuàng)新文化,即不斷的突破、嘗試。

此次打破CAP原則可以說是亞馬遜云科技創(chuàng)新文化很好的體現(xiàn)。正如Matt Garman所說,實(shí)現(xiàn)多區(qū)域強(qiáng)一致性的同時提供低延遲,確實(shí)是一個非常難解決的問題,但是亞馬遜云科技做到了。

Matt Garman舉例進(jìn)一步解釋其中的原理。假設(shè)用戶有一個跨兩個區(qū)域的活動數(shù)據(jù)庫,想要完成一個AA事務(wù),事務(wù)大概有十個語句。正常來說,一來一回,十個提交十個返回,如果是在同一數(shù)據(jù)中心,延遲應(yīng)該非常低,但如果一個在紐約,一個在東京,那延遲就非??捎^了。

如果不懂?dāng)?shù)據(jù)庫也沒關(guān)系,這就好比過去是通信,現(xiàn)在是打電話,延遲就好像是花在路上的時間。這其中有兩種降低延遲的方式,一種是從信件到電報(bào),再到電話,在此基礎(chǔ)上,還有一種辦法就是十個語句一起提交一起返回。

過去數(shù)據(jù)庫一直在通過各種技術(shù)手段盡可能地降低第一種方式的延遲,如今,亞馬遜云科技應(yīng)用到了第二種方式,相信很快其它廠商也會跟進(jìn)。

或許會有人問,十句話有前因后果,如何一起提交?就像我們交談,如何讓說話的順序一致,從而保證最終結(jié)果的實(shí)現(xiàn)。亞馬遜云科技的解決辦法就是加時間戳,讓十句話能按順序執(zhí)行。

據(jù)Matt Garman介紹,亞馬遜云科技通過將事務(wù)處理和存儲層分離,提交語句的時候不需要單獨(dú)返回,然后同時將所有區(qū)域的所有權(quán)限并行化,相當(dāng)于所有區(qū)域并行提交指令,統(tǒng)一處理。而解決順序提交的問題,在傳統(tǒng)數(shù)據(jù)庫中查看時間戳即可,但在分布式數(shù)據(jù)庫中,則需要解決時鐘漂移的問題。

這是又一個難題,但亞馬遜云科技的優(yōu)勢在于全球都有基礎(chǔ)設(shè)施,而且精細(xì)控制到組件級別。為此,Aurora DSQL使用了Amazon Time Sync Service,該服務(wù)在每個 Amazon EC2實(shí)例上添加了硬件參考時鐘,將它們同步到與衛(wèi)星連接的原子鐘,進(jìn)而為世界任何地方提供微秒級的精確時間。問題至此完美解決。

現(xiàn)場,亞馬遜云科技展示了Aurora DSQL與Google Spanner性能對比,前者的讀寫速度是后者的4倍。另外,Aurora DSQL的多區(qū)域可用性達(dá)到99.999%,擴(kuò)展性幾乎無上限,且無需管理基礎(chǔ)設(shè)施,無需配置、修補(bǔ)及管理數(shù)據(jù)庫實(shí)例。

此外,亞馬遜云科技在Amazon DynamoDB中也添加了多區(qū)域強(qiáng)一致性功能,使其性能得到極大提升的同時,也讓非關(guān)系型數(shù)據(jù)庫往前邁進(jìn)了一大步。

看起來不難,但其中又有很多關(guān)鍵點(diǎn)。這大概就是傳說中“會者不難,難者不會”的最佳注解。

04

領(lǐng)先,亞馬遜云科技只需稍微一發(fā)力

可能是亞馬遜云科技太過低調(diào),以至于有人看輕亞馬遜云科技在AI時代的實(shí)力。相信這場秀肌肉的大會開完,很多人的觀點(diǎn)該變了。

論數(shù)據(jù)庫,2024年是Amazon Aurora發(fā)布的十周年。每天有數(shù)十萬客戶使用Amazon Aurora。十周年,站在新的起點(diǎn)上,亞馬遜云科技又帶來了劃時代的新產(chǎn)品。分布式數(shù)據(jù)庫和低延遲之間,不必再二選一了,亞馬遜云科技真正讓用戶做到了我都要。

放大到整個AI這場競賽中,我十分贊同Matt Garman的觀點(diǎn),即AI是一場“沒有終點(diǎn)的競賽”,AI需要不斷地創(chuàng)新迭代,沒有哪個大模型能滿足所有用戶的需要。亞馬遜云科技已全面發(fā)力,AI競賽才剛剛步入正軌。

溫馨提示:點(diǎn)擊“閱讀原文”,了解Amazon Q Developer Code Reviewer更多信息。

*前述特定亞馬遜云科技生成式人工智能相關(guān)的服務(wù)僅在亞馬遜云科技海外區(qū)域可用,亞馬遜云科技中國僅為幫助您發(fā)展海外業(yè)務(wù)和/或了解行業(yè)前沿技術(shù)選擇推薦該服務(wù)。