打開網(wǎng)易新聞 查看精彩圖片

Manus之后,又一款A(yù)gent公測在即,將終結(jié)傳統(tǒng)的ChatBI數(shù)據(jù)幻覺,支持企業(yè)數(shù)據(jù)分析一問到底,其背后的技術(shù)突破是什么?

文|魏德齡

近年來的每一個春節(jié),都成為人工智能的閃耀時刻。隨著DeepSeek V3/ R1模型的發(fā)布,讓本地部署成為了新的熱潮,以至于配合RAG(檢索增強生成),每個人都能在本地終端構(gòu)建自己的知識庫。

但在實際測試使用中便會發(fā)現(xiàn),想要讓 AI 給出符合預(yù)期的回答,并不是把自己的文件往庫里一甩那么簡單,尤其是對于專業(yè)知識的理解學(xué)習(xí)與邏輯推理,AI并非像人們想象中那樣順理成章。

對于早就已經(jīng)邁向數(shù)智化轉(zhuǎn)型的眾多企業(yè)來說,這一問題更是由來已久。以銀行業(yè)為例,日常說“三大行”一詞,通常指工農(nóng)中建交這樣的頭部銀行,但在某銀行的工作對話中,卻是指北京、上海、深圳的分行。再看連鎖快餐行業(yè),某品牌內(nèi)部系統(tǒng)用 “GC” 代表 “訂單數(shù)”,但大模型在面對數(shù)據(jù)表時,可能根本無法理解何為“GC”。

打開網(wǎng)易新聞 查看精彩圖片

Aloudata大應(yīng)科技創(chuàng)始人&CEO周衛(wèi)林

“經(jīng)營決策場景下,企業(yè)知識語義表達的載體就是‘指標(biāo)’,其管理平臺就是‘指標(biāo)平臺’。也因此,指標(biāo)平臺是企業(yè)最為確定性的私域知識庫?!盇loudata大應(yīng)科技創(chuàng)始人&CEO周衛(wèi)林在不久前舉行的NoETL指標(biāo)平臺最佳實踐研討會上表示。

隨著AI技術(shù)的不斷增強,人才、技術(shù)與資本將不再是企業(yè)的真正壁壘,而“知本”作為企業(yè)的獨有認(rèn)知體系和知識庫,一旦形成競爭優(yōu)勢,將難以被復(fù)制和超越。這也是為何市場正在對ChatBI給予強烈關(guān)注的原因所在。

打開網(wǎng)易新聞 查看精彩圖片

然而,如同文章開篇提到的實際知識庫應(yīng)用落地難題,在很多企業(yè)的多年數(shù)據(jù)積累的過程中,本應(yīng)成為競爭壁壘的數(shù)據(jù)知識,卻甚至成為內(nèi)部工作中的阻礙。

01

NoETL破除企業(yè)數(shù)據(jù)之痛

報表口徑不統(tǒng)一,一直是困擾眾多企業(yè)內(nèi)部人員的難題 。平安證券數(shù)據(jù)平臺產(chǎn)品負(fù)責(zé)人倪程偉指出,同一個指標(biāo)可能在不同的報表里呈現(xiàn)不一致,或管理模式調(diào)整切換口徑后,無法更新全部報表,帶來潛在數(shù)據(jù)差異。原因在于指標(biāo)定義分散在報表中,無法共享。

他表示,信息呈現(xiàn)多但數(shù)據(jù)洞察少,也是一個經(jīng)常出現(xiàn)的問題,最終企業(yè)內(nèi)部只是看到了大量的總體數(shù)據(jù),但難以理解數(shù)據(jù)背后的各種維度和變化。也就是說,工具和數(shù)據(jù)難以深入契合場景,進行多維分析、切片分析、關(guān)聯(lián)分析或歸因分析。

還有一點便是重復(fù)開發(fā)的問題,報表數(shù)量眾多,但實際業(yè)務(wù)價值不明確。傳統(tǒng)ETL(數(shù)據(jù)抽取、轉(zhuǎn)換和加載)+數(shù)據(jù)集的生產(chǎn)模式下,開發(fā)工作分散在不同團隊和人員手中,報表開發(fā)周期長、靈活性差,業(yè)務(wù)需求已經(jīng)難以被靈活快速滿足。

另一個在日常生活中最常見的表象,可能就是在進行促銷活動的快餐廳,本來一場營銷活動是想提升客戶的滿意度或拉升月活黏性。然而,活動期間若餐廳應(yīng)對猛增的出餐需求不力,導(dǎo)致出餐速度變慢、油炸食品品相欠佳,或者取餐系統(tǒng)信息滯后,那這次營銷反而可能走向負(fù)面。

這一切表象背后,根源往往在于指標(biāo)難以在各部門間達成統(tǒng)一。例如:供應(yīng)鏈部門關(guān)注物料準(zhǔn)備,運營部門負(fù)責(zé)員工調(diào)配,管理層則通過移動駕駛艙查看數(shù)據(jù)。麥當(dāng)勞中國數(shù)據(jù)中臺負(fù)責(zé)人陳潤紅表示,最后由于數(shù)據(jù)源和計算邏輯不一致,常常在營銷活動進行到一半時,發(fā)現(xiàn)各部門的數(shù)據(jù)對不上,導(dǎo)致決策混亂。

面對不同行業(yè)在數(shù)據(jù)管理和消費過程中所出現(xiàn)的集中痛點,Aloudata在三年前提出了NoETL理念。在業(yè)務(wù)取數(shù)、用數(shù)體感最強烈的場景,即指標(biāo)的生產(chǎn)、管理、消費場景,Aloudata打造了業(yè)界首個“管研用”一體化的NoETL指標(biāo)平臺,通過定義清晰的明細(xì)級指標(biāo)語義,對接數(shù)倉明細(xì)層模型進行指標(biāo)定義,代替中間層和應(yīng)用層的建模,然后通過自動化構(gòu)建和物化加速實現(xiàn)指標(biāo)的定義、開發(fā)、管理、消費的一體化,讓業(yè)務(wù)無需掌握ETL技能,無需等待漫長排期,隨時可對全域數(shù)據(jù)開啟自助靈活的分析與洞察。

打開網(wǎng)易新聞 查看精彩圖片

目前,NoETL指標(biāo)平臺已經(jīng)成為平安證券、麥當(dāng)勞中國、華潤數(shù)科、lululemon、理想汽車等30余家頭部企業(yè)的選擇,該平臺周查詢API調(diào)用量已達億級,助力企業(yè)內(nèi)部指標(biāo)統(tǒng)一性與維度定義的標(biāo)準(zhǔn)化,并實現(xiàn)了數(shù)據(jù)資產(chǎn)的沉淀,提升指標(biāo)開發(fā)管理的降本增效。

“NoETL就是通過將ETL Engineers驅(qū)動的數(shù)據(jù)工程,轉(zhuǎn)變?yōu)镋TL Agents驅(qū)動的數(shù)據(jù)工程,實現(xiàn)數(shù)據(jù)處理流程的自動化重構(gòu)。只有完成這種生產(chǎn)力變革,才能真正滿足AI時代的數(shù)據(jù)分析需求?!敝苄l(wèi)林表示,NoETL不僅解決了當(dāng)下傳統(tǒng)BI體系中最根本的供需矛盾,也正在為ChatBI的真正落地掃清障礙。

02

為Chat BI落地掃清障礙

有人說GPT的爆發(fā)恰恰是被前綴的Chat所點燃。通過自然語言的交互,讓人工智能有機會成為每一個人告別技術(shù)門檻的生產(chǎn)力工具。對于企業(yè)來說,也自然希望在內(nèi)部能夠構(gòu)建起ChatBI,BI作為企業(yè)數(shù)字化進程中最為基礎(chǔ)和普遍的應(yīng)用場景,與AI的結(jié)合已經(jīng)是必然趨勢。

而通過上文內(nèi)容不難發(fā)現(xiàn),ChatBI的關(guān)鍵恰恰在于數(shù)據(jù),解決業(yè)務(wù)日常溝通指標(biāo)口徑與AI獲取指標(biāo)語義保持一致的關(guān)鍵正在于ChatBI與數(shù)據(jù)倉庫之間,必然依賴指標(biāo)平臺實現(xiàn)明細(xì)級的語義層中介,從而實現(xiàn)數(shù)據(jù)的AI-Ready。

打開網(wǎng)易新聞 查看精彩圖片

Aloudata 聯(lián)合創(chuàng)始人兼首席產(chǎn)品官肖裕洪

“我們的口號是‘Less cost, more intelligence’,即以更低的人力成本、存算成本和應(yīng)用接入門檻,實現(xiàn)數(shù)據(jù)的 AI-Ready,以高度自動化的數(shù)據(jù)工程體系推動企業(yè)智能生態(tài)的繁榮發(fā)展?!盇loudata 聯(lián)合創(chuàng)始人兼首席產(chǎn)品官肖裕洪表示,圍繞新的企業(yè)落地目標(biāo),Aloudata進行了一系列產(chǎn)品的關(guān)鍵升級。

打開網(wǎng)易新聞 查看精彩圖片

為了幫助企業(yè)以低成本實現(xiàn)數(shù)據(jù)高效就緒。Aloudata在今年將專門在語義引擎上進行重大升級。

首先是指標(biāo)定義的增強,讓企業(yè)能夠以最優(yōu)雅、最高效的方式定義指標(biāo)和建模。比如支持多角色關(guān)系的建模,支持基于指標(biāo)值定義和快速變更維度(標(biāo)簽),支持公共(雜項)維度的定義;其次是指標(biāo)加速的增強,重點優(yōu)化查詢路由改寫、物化構(gòu)建效率與Cube加速功能;最后是指標(biāo)治理的增強,進一步提高相似指標(biāo)的識別能力,提供更加精細(xì)的審批管理和審計日志,并通過多環(huán)境發(fā)布和字段級的影響評估,進一步提升數(shù)據(jù)質(zhì)量。

Aloudata還將結(jié)合AI技術(shù)推出智能建模助手,以提升企業(yè)在復(fù)雜場景下的數(shù)據(jù)建模效率。

在指標(biāo)和維度的批量創(chuàng)建場景中,智能助手可以顯著提升效率。此外,智能語義助手還可應(yīng)用于更深度的語義生成和洞察分析中,例如可自動提取常用維度或熱門維度,幫助用戶在多維歸因分析的時候更好地選擇合適的分析維度;或者自動從指標(biāo)構(gòu)建血緣、查詢記錄中挖掘出指標(biāo)關(guān)聯(lián)因子指標(biāo),幫助用戶在歸因時自動關(guān)聯(lián)相關(guān)指標(biāo),提供更深入的洞察。

智能助手還可以實時監(jiān)測用戶的分析行為,識別性能瓶頸或不經(jīng)濟的查詢模式,并提前進行智能加速,確保分析體驗的流暢性;以及自動盤點企業(yè)中的重復(fù)指標(biāo)或無用指標(biāo),為管理者提供清晰的管理視圖,提升治理效率。

打開網(wǎng)易新聞 查看精彩圖片

Aloudata AIR和Aloudata CAN兩大平臺作為以NoETL理念所打造的產(chǎn)品,將通過深度融合,確保企業(yè)的所有數(shù)據(jù)能夠輕松連接和高效利用,并為企業(yè)的多智能體生態(tài)提供單一可信的數(shù)據(jù)服務(wù)。Aloudata目標(biāo)未來在存算層、用戶體系層、權(quán)限層和血緣關(guān)系上,實現(xiàn)更深層次的融通。

“在 AI 時代,企業(yè)要為各種智能體提供一份單一可信的數(shù)據(jù)源,而 Aloudata AIR同Aloudata CAN的深度融合,形成了一個路徑更短、成本更低、自動化程度更高的 NoETL工程體系,將有力支撐企業(yè)的數(shù)字化重心從‘?dāng)?shù)據(jù)呈現(xiàn)’轉(zhuǎn)移到‘?dāng)?shù)據(jù)洞察’?!毙ぴ:楸硎?,融合的原因在于企業(yè)對數(shù)據(jù)就緒速度的需求顯著提高,而數(shù)據(jù)編織能夠借助數(shù)據(jù)虛擬化技術(shù),達成輕量級數(shù)據(jù)集成與準(zhǔn)備、按需物化的效果。

在實際業(yè)務(wù)推進過程中,Aloudata AIR邏輯數(shù)據(jù)編織解決方案,是為ChatBI進行快速、低成本的數(shù)據(jù)集成準(zhǔn)備的理想方案。

隨著 AI-Ready 數(shù)據(jù)底座構(gòu)建的進一步完善,明細(xì)級的指標(biāo)語義層實現(xiàn)了數(shù)據(jù)覆蓋度的最大化——既包含清晰的指標(biāo)與維度語義定義,又基于明細(xì)數(shù)據(jù)支持所有指標(biāo)和維度的靈活組合,還可以支持最細(xì)粒度的歸因下鉆。這也意味著ChatBI最后的落地障礙被掃清,秉持著 “既許人以援手,必扶持到底” 的理念,Aloudata宣布將于4月下旬推出一款以“萬數(shù)皆可問”為目標(biāo)的ChatBI智能體——Aloudata Agent。

03

“萬數(shù)皆可問”的Chat BI智能體

“‘萬數(shù)皆可問’不僅是一個愿景,更是我們通過技術(shù)手段實現(xiàn)的承諾。我們希望通過一個強大的 NoETL數(shù)據(jù)底座,為上層的Aloudata Agent提供更完整的數(shù)據(jù)覆蓋、更精準(zhǔn)的數(shù)據(jù)語義、更強大的查詢性能和更可靠的安全保障?!毙ぴ:楸硎尽?/p>

打開網(wǎng)易新聞 查看精彩圖片

Aloudata Agent的目標(biāo),是解決ChatBI在數(shù)據(jù)查詢中面臨的諸多挑戰(zhàn)。例如數(shù)據(jù)覆蓋度不足、口徑不一致引發(fā)的準(zhǔn)確性問題、性能不穩(wěn)定或不可控的查詢響應(yīng)問題,以及數(shù)據(jù)越權(quán)或泄露的安全問題。Aloudata Agent目前已經(jīng)具備了一些重要的功能和特性,能夠為企業(yè)提供初步的智能化支持。

第一是對話式分析。Aloudata Agent支持靈活、準(zhǔn)確的對話式取數(shù)、歸因分析和智能分析報告生成。結(jié)合明細(xì)級的語義層和查詢時靈活衍生的能力,Aloudata Agent不受預(yù)定義局限,可以實現(xiàn)任意指標(biāo)(基礎(chǔ)度量)與維度的靈活組合分析;結(jié)合NoETL自動化查詢加速能力,Aloudata Agent無需數(shù)倉預(yù)加工寬表,進一步釋放問數(shù)的靈活性和實時性。未來將會通過迭代升級,達到與專業(yè)分析師同級別的歸因分析能力,能夠提出假設(shè)與驗證假設(shè)。

第二是分析過程透明化。在ChatBI這種容錯性較低的場景中,分析過程的透明化至關(guān)重要。Aloudata Agent會清晰呈現(xiàn)分析過程,保留中間產(chǎn)物。如此一來,用戶可以清楚地知曉每一步的分析邏輯,并且在后續(xù)需要時,能夠?qū)Ψ治鲞M行回溯和審計。

第三是數(shù)據(jù)準(zhǔn)確可信。Aloudata Agent的數(shù)據(jù)準(zhǔn)確性依賴于 Aloudata CAN指標(biāo)平臺的標(biāo)準(zhǔn)化明細(xì)級語義沉淀。它能夠?qū)⒂脩舻膯柎鹋c企業(yè)標(biāo)準(zhǔn)指標(biāo)口徑對齊,確保分析結(jié)果的準(zhǔn)確性和可信度。

第四是數(shù)據(jù)安全可保障。Aloudata通過指標(biāo)平臺所具備的精細(xì)化的數(shù)據(jù)權(quán)限管理功能,確保數(shù)據(jù)在分析過程中的安全性和可控性。

為了配合Aloudata Agent的推出,Aloudata還提供了面向AI的API和SDK,賦能企業(yè)快速實現(xiàn)AI應(yīng)用創(chuàng)新,構(gòu)建智能體生態(tài)。 Aloudata AI API是一套加速企業(yè)AI 應(yīng)用開發(fā)的工具集,尤其對 RAG場景進行了深度優(yōu)化,旨在通過簡化數(shù)據(jù)集成與復(fù)雜分析流程,幫助企業(yè)更高效地構(gòu)建智能應(yīng)用。

在NoETL指標(biāo)平臺最佳實踐研討會上,周衛(wèi)林專門談到了針對企業(yè)ChatBI落地的三個建議,即“好數(shù)據(jù),強智能”、“可溯源,可審計”、“全開放,大生態(tài)”??v觀Aloudata依托NoETL理念打造并持續(xù)升級的產(chǎn)品,以及最新發(fā)布的Aloudata Agent,無疑正在圍繞這18個字,為企業(yè)構(gòu)建起AGI時代的數(shù)智基建。

“我們堅信,AI 時代的關(guān)鍵是Data,是知識庫,是數(shù)據(jù)語義層,是數(shù)據(jù)虛擬化,這是我們的判斷,也是我們創(chuàng)立這家公司的初心?!敝苄l(wèi)林這樣介紹了“Aloudata”名稱的由來,它源于“AI on data”的理念。

自NoETL理念誕生的三年以來,正在逐步筑牢企業(yè)的數(shù)據(jù)根基,化阻礙為“知本”壁壘。如今,隨著Aloudata圍繞AI時代進行的一系列升級,以及Aloudata Agent的全新推出,在“好數(shù)據(jù)”的根基之上,為企業(yè)種下了“萬數(shù)皆可問”的知識之樹。