作者|冬梅
內(nèi)卷退潮,數(shù)據(jù)庫行業(yè)進(jìn)入產(chǎn)品時(shí)代
中國分布式數(shù)據(jù)庫市場(chǎng)正迎來高速增長期。
今年 2 月份,據(jù)國際數(shù)據(jù)公司(IDC)首次發(fā)布的《2024 年上半年中國分布式事務(wù)數(shù)據(jù)庫軟件市場(chǎng)跟蹤報(bào)告》顯示,2024 上半年中國分布式事務(wù)數(shù)據(jù)庫軟件市場(chǎng)規(guī)模為 1.5 億美元,同比增長 18.5%。
分布式事務(wù)數(shù)據(jù)庫利用分布式技術(shù),突破了傳統(tǒng)集中數(shù)據(jù)庫的容量與性能瓶頸,簡化了過去依賴人工進(jìn)行分庫分表的繁雜和高風(fēng)險(xiǎn)工作,并有助于降低數(shù)據(jù)庫對(duì)高性能硬件的依賴。2024 年,分布式事務(wù)數(shù)據(jù)庫產(chǎn)品和技術(shù)逐步成熟,已廣泛應(yīng)用于泛互聯(lián)網(wǎng)、金融、運(yùn)營商等行業(yè),產(chǎn)品應(yīng)用已經(jīng)進(jìn)入規(guī)?;A段。
IDC 還預(yù)測(cè),2024 年全年,中國分布式事務(wù)數(shù)據(jù)庫市場(chǎng)規(guī)模預(yù)計(jì)為 8.1 億美元,同比增長 20.3%。到 2028 年,中國分布式事務(wù)數(shù)據(jù)庫市場(chǎng)規(guī)模將達(dá)到 18.2 億美元,2023-2028 的 5 年市場(chǎng)年復(fù)合增長率(CAGR)為 22.0%。
根據(jù) Gartner 技術(shù)成熟度曲線,當(dāng)一項(xiàng)技術(shù)的市場(chǎng)滲透率超過 20% 時(shí),意味著它已經(jīng)跨越“鴻溝”,從早期采用者走向早期大眾市場(chǎng),也意味著,數(shù)據(jù)庫行業(yè)已經(jīng)開始進(jìn)入產(chǎn)品化時(shí)代。

而這背后的市場(chǎng)驅(qū)動(dòng)力主要來自兩個(gè)方面:一是國產(chǎn)升級(jí)進(jìn)入深水區(qū)。隨著 2023 年“國測(cè)名單”的發(fā)布,金融、電信、政務(wù)等關(guān)鍵行業(yè)的核心系統(tǒng)開始從“外圍系統(tǒng)升級(jí)”轉(zhuǎn)向“核心系統(tǒng)升級(jí)”。中國信通院數(shù)據(jù)顯示,2023 年金融行業(yè)分布式數(shù)據(jù)庫采購量同比增長 47%,其中核心交易系統(tǒng)占比首次超過 30%;二是 AI 革命催生新需求。大模型訓(xùn)練需要處理 PB 級(jí)非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)集中式數(shù)據(jù)庫面臨巨大挑戰(zhàn)。

IDC 的另一項(xiàng)數(shù)據(jù)顯示,未來四年,本地部署的國產(chǎn)分布式數(shù)據(jù)庫市場(chǎng)份額將實(shí)現(xiàn) 10 個(gè)百分點(diǎn)的跨越式增長,整體市場(chǎng)占比突破 30% 大關(guān)。尤為引人注目的是,2025 年本地部署市場(chǎng)的增速將首次超越云上部署市場(chǎng),這對(duì)所有數(shù)據(jù)庫企業(yè)來說都是個(gè)巨大的機(jī)遇。

OceanBase CEO 楊冰認(rèn)為,2025 年將成為中國數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展的重要分水嶺。而在這樣的歷史背景下,OceanBase 順勢(shì)而為推出了單機(jī)版數(shù)據(jù)庫,豐富了 OceanBase 產(chǎn)品矩陣中的又一版圖。
單機(jī)版 OceanBase,中小規(guī)模業(yè)務(wù)中的“性價(jià)比之王”據(jù)悉,這款單機(jī)版產(chǎn)品基于自主研發(fā)的單機(jī)分布式一體化架構(gòu)設(shè)計(jì),具備極簡數(shù)據(jù)庫架構(gòu)和高度兼容性,為中小規(guī)模業(yè)務(wù)提供兼具性能與成本效益的單機(jī)數(shù)據(jù)庫解決方案,滿足客戶從分布式到單機(jī)場(chǎng)景的多元化需求。
那么,OceanBase 為什么要在這樣的時(shí)間節(jié)點(diǎn)推出這樣一款單機(jī)版產(chǎn)品,它又具備怎樣的產(chǎn)品能力?
簡而言之,這款產(chǎn)品和之前的幾代產(chǎn)品一樣,都是客戶需求的產(chǎn)物。
OceanBase 自 2010 年成立至今始終貫徹“一體化”產(chǎn)品設(shè)計(jì)理念。三年前,通過技術(shù)創(chuàng)新突破分布式數(shù)據(jù)庫的性能瓶頸,打造出業(yè)內(nèi)首個(gè)單機(jī)分布式一體化架構(gòu),兼顧分布式系統(tǒng)的水平擴(kuò)展優(yōu)勢(shì)與集中式數(shù)據(jù)庫的單機(jī)性能優(yōu)勢(shì)。
OceanBase 產(chǎn)品部總經(jīng)理?xiàng)钪矩S介紹,此次發(fā)布的單機(jī)版,正是在單機(jī)分布式一體化架構(gòu)基礎(chǔ)上持續(xù)創(chuàng)新單機(jī)技術(shù),進(jìn)一步擴(kuò)展產(chǎn)品形態(tài),滿足企業(yè)從分布式到單機(jī)場(chǎng)景的多元化需求。
就產(chǎn)品能力而言,OceanBase 單機(jī)版以單機(jī)分布式一體化架構(gòu)為核心,實(shí)現(xiàn)了單機(jī)部署并兼顧分布式架構(gòu)的擴(kuò)展性與集中式架構(gòu)的性能優(yōu)勢(shì),支持企業(yè)數(shù)據(jù)庫“從小到大”的更多場(chǎng)景下的多樣化需求, 為中小規(guī)模業(yè)務(wù)提供兼具性能與成本效益的單機(jī)數(shù)據(jù)庫解決方案。主要功能包含以下幾點(diǎn):
100% 根自研、平滑遷移 Oracle/MySQL:通過高度兼容 MySQL 及 Oracle,提供自動(dòng)化遷移評(píng)估工具與數(shù)據(jù)同步引擎,企業(yè)可快速完成存量系統(tǒng)的遷移適配。遷移過程中支持在線數(shù)據(jù)校驗(yàn)與差異修復(fù),確保業(yè)務(wù)切換的完整性與一致性,最大程度降低遷移風(fēng)險(xiǎn)與停機(jī)時(shí)間;
支持 HTAP 混合事務(wù)與實(shí)時(shí)分析處理:基于一體化存儲(chǔ)引擎實(shí)現(xiàn)事務(wù)處理與實(shí)時(shí)分析的資源隔離與協(xié)同調(diào)度,允許在同一份數(shù)據(jù)上并行執(zhí)行高并發(fā) OLTP 操作與復(fù)雜 OLAP 查詢。通過智能資源分配算法避免分析型負(fù)載對(duì)事務(wù)性能的干擾,幫助企業(yè)在無需構(gòu)建獨(dú)立數(shù)倉的情況下實(shí)現(xiàn)實(shí)時(shí)業(yè)務(wù)洞察;
具備多模數(shù)據(jù)處理能力:通過一個(gè)引擎原生支持多種數(shù)據(jù)訪問模式,涵蓋 SQL 和 NoSQL API,滿足多樣化數(shù)據(jù)模型的需求,簡化數(shù)據(jù)架構(gòu)。支持多種數(shù)據(jù)類型,包括鍵值、JSON、GIS、XML 和 SQL 查詢,并提供 Table API,兼容 HBase、Redis API,確保在大規(guī)模數(shù)據(jù)存儲(chǔ)和高性能讀寫場(chǎng)景中,始終展現(xiàn)卓越的處理能力;
內(nèi)嵌高級(jí)壓縮技術(shù):基于 LSM-Tree 存儲(chǔ)引擎的層級(jí)壓縮策略,在數(shù)據(jù)寫入時(shí)通過智能編碼減少冗余存儲(chǔ),結(jié)合后臺(tái)異步合并機(jī)制實(shí)現(xiàn)存儲(chǔ)空間節(jié)省與查詢性能的平衡。實(shí)際測(cè)試表明,該技術(shù)可將典型業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)成本降低 70%~90%,同時(shí)保持事務(wù)處理延遲不高于傳統(tǒng)行存數(shù)據(jù)庫;
單機(jī)高性能:測(cè)試結(jié)果表明,在典型的 16 核服務(wù)器配置下,經(jīng)過 Sysbench 標(biāo)準(zhǔn)測(cè)試集的實(shí)際測(cè)試,OceanBase 單機(jī)版在整體性能(包括查詢、批量讀取、寫入、讀寫混合、插入和更新操作)方面全面優(yōu)于 MySQL 8.0;
具備單機(jī)分布式一體化能力:OceanBase 單機(jī)版支持通過技術(shù)路徑實(shí)現(xiàn)平滑擴(kuò)展,基于單機(jī)分布式一體化架構(gòu)實(shí)現(xiàn)從單機(jī)單節(jié)點(diǎn)到多節(jié)點(diǎn)分布式架構(gòu)的平滑升級(jí)。該特性使企業(yè)能夠根據(jù)實(shí)際業(yè)務(wù)規(guī)模,在初期階段選擇單機(jī)版部署以降低資源投入。隨著業(yè)務(wù)增長,可通過動(dòng)態(tài)增減節(jié)點(diǎn)實(shí)現(xiàn)彈性擴(kuò)展,從而確保企業(yè)能夠根據(jù)不同發(fā)展階段選擇最適合的數(shù)據(jù)庫架構(gòu),靈活應(yīng)對(duì)業(yè)務(wù)需求的變化。
經(jīng)實(shí)際測(cè)試,在典型的 16 核服務(wù)器配置下,經(jīng)過 sysbench 標(biāo)準(zhǔn)測(cè)試集的實(shí)際測(cè)試,OceanBase 單機(jī)版的整體性能全面優(yōu)于 MySQL 8.0。特別是在高并發(fā)寫入場(chǎng)景中,通過自適應(yīng)事務(wù)優(yōu)化機(jī)制,吞吐量實(shí)現(xiàn)顯著提升,最高提升達(dá)到 214.99%,能夠滿足高負(fù)載場(chǎng)景下的業(yè)務(wù)需求。

OceanBase 單機(jī)版專為中小規(guī)模業(yè)務(wù)場(chǎng)景設(shè)計(jì),適用于非核心場(chǎng)景、國產(chǎn)升級(jí)場(chǎng)景,以及分布式與單機(jī)混合部署場(chǎng)景,幫助企業(yè)在分布式核心系統(tǒng)與單機(jī)非核心系統(tǒng)的技術(shù)棧統(tǒng)一,多層級(jí)分布式與單機(jī)混合架構(gòu)技術(shù)棧統(tǒng)一,以及面向單機(jī)數(shù)據(jù)庫國產(chǎn)升級(jí)提供不止于平替、面向未來的架構(gòu)升級(jí)。
踐行一體化架構(gòu)理念,
一路“打怪”,一路升級(jí)
OceanBase 的“一體化”之路,經(jīng)歷了幾個(gè)關(guān)鍵發(fā)展階段。
最初,從早期客戶在互聯(lián)網(wǎng)場(chǎng)景 MySQL 需求,到金融行業(yè)和電信行業(yè)的核心系統(tǒng)對(duì) Oracle 兼容性的需求,推動(dòng) OceanBase 一體化 SQL 引擎的出現(xiàn),通過一個(gè)引擎同時(shí)實(shí)現(xiàn) Oracle 和 MySQL 兩種數(shù)據(jù)庫的高度兼容,滿足了不同業(yè)務(wù)的多樣化需求。
2022 年 8 月,OceanBase 發(fā)布 4.0 版本“小魚”,并首次公開提出了單機(jī)分布式一體化這一理念,旨在適應(yīng)大小不同規(guī)模的工作負(fù)載,實(shí)現(xiàn)了分布式可單機(jī)部署,進(jìn)一步降低了大家使用分布式數(shù)據(jù)庫的復(fù)雜度。
4.0 的發(fā)布也徹底顛覆了行業(yè)認(rèn)知——在此之前,公眾對(duì)分布式數(shù)據(jù)庫的普遍認(rèn)知是需要多臺(tái)服務(wù)器部署,更適合服務(wù)大企業(yè)的海量數(shù)據(jù)存儲(chǔ)和分析。4.0 證明了,原來分布式數(shù)據(jù)庫不僅能跑在銀行、電商這些“大塊頭”系統(tǒng)里,現(xiàn)在連個(gè)人小站都能輕松駕馭,企業(yè)再也不用糾結(jié)于是否要采用分布式了,一套架構(gòu)隨業(yè)務(wù)自由伸縮,性價(jià)比和穩(wěn)定性都能兼顧。
4.0 發(fā)布后,OceanBase 在一體化產(chǎn)品上持續(xù)投入,布局在多工作負(fù)載、多模、向量等一體化能力的持續(xù)研發(fā)。
2024 年 4 月,OceanBase 4.3 發(fā)布,該版本深入探索 TP/AP 一體化,打造 PB 級(jí)實(shí)時(shí)分析數(shù)據(jù)庫。該版本從 AP 存儲(chǔ)入手,基于 LSM-Tree 架構(gòu)推出列式存儲(chǔ)引擎,實(shí)現(xiàn)可行存、可行列混存和可列存的多種存儲(chǔ)方式,同時(shí)融入分布式 TP 核心能力小事務(wù)寫入技術(shù),有效消除數(shù)據(jù)導(dǎo)入延遲,滿足更嚴(yán)苛的 AP 實(shí)時(shí)分析需求。同時(shí)全新推出基于 Column 數(shù)據(jù)格式描述的 2.0 向量化引擎和物化視圖,進(jìn)一步提升了深度 AP 場(chǎng)景下的性能表現(xiàn),可實(shí)現(xiàn)秒級(jí)實(shí)時(shí)分析,極大提升 OLAP 實(shí)時(shí)分析的能力。
2024 年 10 月,OceanBase 推出 4.3.3 GA 版本,升級(jí)向量檢索與索引功能,實(shí)現(xiàn) SQL+AI 一體化。該版本深度融合 AI 與數(shù)據(jù)庫處理能力,支持多模態(tài)數(shù)據(jù)的融合查詢,幫助企業(yè)簡化 AI 技術(shù)棧,提升 AI 應(yīng)用構(gòu)建效率。
隨著 AI 技術(shù)發(fā)展,越來越多的 AI 應(yīng)用不再局限于純文本來生成回答,涉及的數(shù)據(jù)類型日益復(fù)雜,并且常存儲(chǔ)于 IT 架構(gòu)的不同數(shù)據(jù)庫中,這對(duì)數(shù)據(jù)庫提出了新的要求,包括提升性能與響應(yīng)速度,要求數(shù)據(jù)庫處理和存儲(chǔ)不同類型的數(shù)據(jù),并支持結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的復(fù)雜融合查詢。
基于以上種種可見,OceanBase 一體化數(shù)據(jù)庫的發(fā)展歷程并非簡單的技術(shù)堆砌,而是一個(gè)與客戶需求深度耦合、持續(xù)演進(jìn)的有機(jī)過程。
后 AI 時(shí)代,國際數(shù)據(jù)庫巨頭
競逐“一體化”賽道
過去幾個(gè)月,我們見證了以 DeepSeek R1、Gemini 2.5、GPT-4o、Qwen2.5-Max 為代表的一系列大模型的爆炸式涌現(xiàn),當(dāng) AI 開始重構(gòu)所有行業(yè)的運(yùn)營邏輯時(shí),一體化數(shù)據(jù)庫正成為突破傳統(tǒng)數(shù)據(jù)管理瓶頸的關(guān)鍵技術(shù)。這種新型數(shù)據(jù)庫架構(gòu)通過整合多種數(shù)據(jù)處理能力,有效解決了傳統(tǒng)方案面臨的三大痛點(diǎn):技術(shù)棧割裂帶來的高復(fù)雜度、多系統(tǒng)運(yùn)維的沉重負(fù)擔(dān)以及跨數(shù)據(jù)類型處理的效率瓶頸。
不只是 OceanBase 在加快向一體化數(shù)據(jù)庫演進(jìn)的速度,放眼國際,不少全球頭部數(shù)據(jù)庫廠商也在積極推進(jìn)向一體化數(shù)據(jù)庫的演進(jìn)。
作為 NoSQL 數(shù)據(jù)庫的領(lǐng)頭羊,MongoDB 的核心優(yōu)勢(shì)在于其面向開發(fā)者的多模數(shù)據(jù)庫平臺(tái),例如其 Atlas 服務(wù)支持文檔、鍵值、圖數(shù)據(jù)和全文搜索等多種模型,并通過自動(dòng)化擴(kuò)展、多云部署簡化數(shù)據(jù)架構(gòu)管理。
近年來,MongoDB 持續(xù)優(yōu)化 NoSQL 與 SQL 的融合,例如增強(qiáng)對(duì) JSON 數(shù)據(jù)的支持,使其既能保持靈活的非關(guān)系型數(shù)據(jù)存儲(chǔ),又能提供類似 SQL 的查詢體驗(yàn)。然而,MongoDB 仍需突破的關(guān)鍵點(diǎn)在于混合負(fù)載(HTAP)的平衡——如何在高并發(fā)事務(wù)處理(TP)與復(fù)雜分析查詢(AP)之間實(shí)現(xiàn)更優(yōu)的資源調(diào)度,同時(shí)提升數(shù)據(jù)一致性和查詢性能。
全球單機(jī)數(shù)據(jù)庫領(lǐng)導(dǎo)者 Oracle 也已經(jīng)通過 Autonomous Database 向一體化方向邁進(jìn),整合了 AI、機(jī)器學(xué)習(xí)和多模數(shù)據(jù)處理能力,支持關(guān)系型、文檔(JSON)、圖形甚至向量數(shù)據(jù)等多種模式。
Oracle 的另一大優(yōu)勢(shì)在于其 HTAP 能力,能在同一平臺(tái)上高效處理事務(wù)型和分析型任務(wù),適用于復(fù)雜業(yè)務(wù)場(chǎng)景。不過,Oracle 仍需解決大規(guī)模多租戶環(huán)境下的資源隔離和性能優(yōu)化 問題,尤其是在高負(fù)載分析任務(wù)下如何平衡資源利用率與成本控制。
此外,Amazon Redshift、Google BigQuery 等云數(shù)據(jù)倉庫也在不斷優(yōu)化其一體化數(shù)據(jù)庫的功能和性能,以滿足用戶對(duì)高效、靈活數(shù)據(jù)處理的需求。
隨著企業(yè)數(shù)據(jù)場(chǎng)景日益復(fù)雜,單一功能的數(shù)據(jù)庫已難以滿足需求。包括 MongoDB、Oracle 在內(nèi)的國際頭部數(shù)據(jù)庫廠商的探索表明,未來的數(shù)據(jù)庫不僅需要支持多模數(shù)據(jù),還需在 HTAP、AI 集成、云原生架構(gòu)等方面持續(xù)突破。誰能率先解決這些技術(shù)難題,誰就可能在下一代數(shù)據(jù)庫競爭中占據(jù)先機(jī)。
熱門跟貼