前幾天看到一個有趣的比喻——

有人將ChatGPT比作iPhone,它的出現(xiàn),帶來了一種全新的概念(大模型/智能手機)。而DeepSeek,則被比作是國產(chǎn)安卓手機,它的作用,是讓這個概念真正走進了千家萬戶。

我個人認為,這個比喻是非常貼切的。今年以來,DeepSeek的橫空出世,掀起了一股席卷全球的AI浪潮。它憑借混合專家(MoE)架構(gòu)、多頭潛在注意力(MLA)機制、低精度訓(xùn)練(FP8)策略等技術(shù)創(chuàng)新,不僅提升了模型的性能,還大幅降低了訓(xùn)練和推理成本,對AI的發(fā)展產(chǎn)生了深遠影響。

簡單來說,就是DeepSeek讓更多的人都能用得起大模型了。隨著DeepSeek的火爆出圈,AI落地全面提速,端側(cè)AI更是進入了爆炸式增長的階段。

端側(cè)AI,為什么會爆發(fā)?

對AI稍有了解的讀者都知道,大模型的構(gòu)建和使用,包括了訓(xùn)練和推理兩個過程。訓(xùn)練,是通過“投喂”數(shù)據(jù),找到更佳的模型參數(shù),讓大模型變成可用的狀態(tài)。推理,則是將大模型投入應(yīng)用,針對新數(shù)據(jù)進行預(yù)測。

打開網(wǎng)易新聞 查看精彩圖片

訓(xùn)練與推理

大模型發(fā)展的早期階段,訓(xùn)練和推理都是在云端完成的。端側(cè)AI,則是指將大模型直接部署在終端設(shè)備(例如智能手機、售貨機、POS機、汽車等)上,在端側(cè)進行推理,以此提供更好的實時響應(yīng)能力和數(shù)據(jù)安全性。

端側(cè)AI相比云端AI,主要區(qū)別在于算力相對較弱,以及對功耗和成本非常敏感。DeepSeek引領(lǐng)的大模型“平民化”熱潮,恰逢其時地解決了這個問題,為端側(cè)AI的發(fā)展掃清了障礙。

DeepSeek通過蒸餾技術(shù)和算法優(yōu)化,顯著降低了大模型的存儲需求與計算量。通過技術(shù)開源和硬件適配,端側(cè)設(shè)備的AI功能集成門檻明顯下降了?;诮K端設(shè)備模組有限的算力,也能夠部署一定級別的大模型,滿足AI應(yīng)用場景需求。

打開網(wǎng)易新聞 查看精彩圖片

我們以業(yè)界知名物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠通信的方案為例。他們針對不同場景,推出了一系列高中低端AI算力模組。

其中,旗艦邊緣計算智能模組SG885G,搭載高通? QCS8550高性能平臺,具備高達48 TOPS的綜合算力。

SG885G此前已率先成功實現(xiàn)了DeepSeek-R1蒸餾小模型的穩(wěn)定運行。實測數(shù)據(jù)顯示,其生成tokens的速度超過每秒40個tokens,且未來隨著性能的不斷優(yōu)化,速度還將進一步提升,為智能終端設(shè)備帶來更強大的AI能力。

面向高端的SG560D模組,同樣來自高通平臺(QCM6490),綜合算力可以達到14 TOPS。

移遠也有來自國產(chǎn)平臺的智能模組。如面向中端的SG530C,采用的就是紫光展銳的UIS7885平臺,算力達到8 TOPS。

面對低端場景,移遠也能提供對應(yīng)的方案。例如SG368Z和SC362Z-AP,算力為1 TOPS,適合對成本和功耗有更高要求的場景。

打開網(wǎng)易新聞 查看精彩圖片

模組的算力,是端側(cè)AI落地的一個前提條件。但更重要的是,需要充分了解用戶的需求,在方案設(shè)計驗證、模型微調(diào)、模型部署等方面具備工程化的能力。

移遠通信在這些方面已經(jīng)積累了豐富的經(jīng)驗。

在方案方面,移遠針對業(yè)界各大主流模型進行了大量驗證,摸清了模型的能力邊界和適用場景。在用戶場景中,如果直接采用現(xiàn)成模型構(gòu)建方案,會導(dǎo)致嚴重的精度和準確性問題。而移遠會基于用戶場景,進行模型微調(diào),確保模型與場景完全匹配,用戶能獲得最佳體驗。

模型部署更是移遠的強項。他們深耕行業(yè)多年,對垂直行業(yè)有非常充分的了解,能夠針對不同行業(yè)用戶的場景需求,進行從小模型到大模型的適配部署。

端側(cè)AI落地,不僅考驗硬件算力,也考驗軟件算法。而算法,是基于數(shù)據(jù)不斷磨合而成熟的。移遠通信在算力、算法和數(shù)據(jù)方面,都具有自身獨特的優(yōu)勢,從而形成了強大的市場競爭力,也成為行業(yè)用戶的合作首選。

接下來,我們不妨從目前端側(cè)AI最火爆的兩個應(yīng)用方向,詳細看看移遠方案究竟是如何落地的。

機器人

先來看看現(xiàn)在最熱門的機器人(具身智能)賽道。

具身智能是機器人智能的理論基礎(chǔ),而機器人是具身智能的物理載體。目前,業(yè)界普遍認為,機器人(具身智能)是大模型技術(shù)在端側(cè)落地的關(guān)鍵場景,已經(jīng)進入了高速發(fā)展的快車道。

機器人,尤其是服務(wù)類機器人,需要與用戶進行直接交互,需要應(yīng)對復(fù)雜場景下的感知、決策和控制任務(wù),對實時數(shù)據(jù)處理有極高的要求。

通過在端側(cè)集成AI大模型,服務(wù)機器人能夠在本地進行數(shù)據(jù)處理,大幅降低數(shù)據(jù)延遲,提高響應(yīng)速度。用戶可以獲得更加流暢、智能、高效的機器人服務(wù)體驗。

移遠通信的端側(cè)大模型解決方案,已經(jīng)成功實現(xiàn)了在服務(wù)機器人領(lǐng)域的落地。

該方案基于SG885G模組,融合了前沿的LLM(大語言模型)、RAG(檢索增強生成)與Agent(智能體)等業(yè)界主流技術(shù),可以實現(xiàn) “情景理解、知識融合、智能交互、自主決策、任務(wù)執(zhí)行”等多種功能。

在移遠端側(cè)大模型解決方案的助力下,服務(wù)機器人可實現(xiàn)1s以內(nèi)的意圖識別,解碼速率超過15 tokens/s(人的正常語速約為10 tokens/s),語音交互更加自然。

目前,在醫(yī)療康養(yǎng)、智能客服、接待導(dǎo)覽、零售導(dǎo)購等多個實際場景,移遠大模型解決方案賦能的服務(wù)機器人,都展現(xiàn)出了強大的應(yīng)用價值,也吸引了行業(yè)內(nèi)外的廣泛關(guān)注。

不久前,移遠通信聯(lián)合德壹發(fā)布了全球首款搭載端側(cè)大模型的AI具身理療機器人,就非常有代表性。

打開網(wǎng)易新聞 查看精彩圖片

這款創(chuàng)新產(chǎn)品支持8自由度3D視覺導(dǎo)航,融合尖端AI技術(shù)、中醫(yī)理療智慧與具身智能,可以實現(xiàn)“無人化、個性化、精準化”的理療體驗。

這款機器人甚至可以支持無網(wǎng)模式。在沒有網(wǎng)絡(luò)連接、沒有理療師介入的情況下,它都可以快速且準確地理解用戶的自然語言指令和意圖,高效完成通用聊天、醫(yī)療領(lǐng)域RAG問答、指令控制等任務(wù)。

此外,德壹機器人還具備很強的觀察能力。它借助多模態(tài)感知技術(shù)(視覺+力控+紅外熱成像),實時掃描用戶身體,精準識別人體經(jīng)絡(luò)與穴位。通過結(jié)合用戶健康數(shù)據(jù)與實時體征,德壹機器人能夠動態(tài)生成個性化理療方案。

目前,在亞健康調(diào)理、慢性疼痛緩解、產(chǎn)后康復(fù)等多個場景,德壹機器人都已投入商用,為用戶提供服務(wù)。

AI智能無人零售

自動售貨機是大家比較常見的一個物聯(lián)網(wǎng)應(yīng)用場景。

在多年的發(fā)展歷程中,自動售貨行業(yè)經(jīng)歷了從機械式到RFID射頻技術(shù)、重力感應(yīng)、靜態(tài)視覺識別、動態(tài)視覺識別等多種商品識別方式的演變。 從靜態(tài)視覺到動態(tài)視覺,均以AI視覺識別能力為基礎(chǔ),且依賴于物聯(lián)網(wǎng)技術(shù)的支撐。

在2025世界移動通信大會(MWC)上,移遠通信宣布推出全新AI智能無人零售解決方案,采用的就是前沿的“動態(tài)視覺+邊緣計算”技術(shù)。

打開網(wǎng)易新聞 查看精彩圖片

該方案采用高性能5G AI算力模組SG560D(同時也兼容其它多款算力模組),依托在自研算法上的深厚技術(shù)積累,對硬件推理性能進行了深度優(yōu)化,可以直接對實時動態(tài)視頻流進行計算,實現(xiàn)精準商品識別和秒級響應(yīng)速度,帶給消費者“掃碼開門、即拿即走”的無縫購物體驗。

在SKU(庫存單位)方面,該方案經(jīng)過海量數(shù)據(jù)的深度訓(xùn)練,具備更強的模型泛化能力,可精準識別上千種商品。方案的模型能力還能持續(xù)在線升級,不斷拓展可識別商品的種類。

在準確率方面,方案采用“單/雙攝像頭+智能算法識別”等多重機制,并結(jié)合重量等數(shù)據(jù)進行交叉驗證,可以實現(xiàn)高達99%的端到端識別準確率。

在支撐客戶運營方面,方案可無縫對接客戶應(yīng)用程序,為其提供全棧式技術(shù)與服務(wù)支撐,實現(xiàn)實時數(shù)據(jù)分析,并且能夠深度洞察消費偏好。這可以助力客戶實現(xiàn)數(shù)據(jù)驅(qū)動的精細化運營,進一步降本增效。

目前,移遠AI智能無人零售解決方案已經(jīng)與興元科技“喵星人”智能售貨機等多家客戶產(chǎn)品完成系統(tǒng)集成,并進入實地場景測試階段。

開發(fā)板——端側(cè)AI產(chǎn)品開發(fā)神器

除了豐富的AI模組及解決方案,在加速端側(cè)AI應(yīng)用落地的過程中,移遠通信還打造了QuecPi Alpha智能生態(tài)開發(fā)板,以高效、靈活等優(yōu)勢,推動端側(cè)AI技術(shù)不斷突破。

在2025世界移動通信大會(MWC)上,該開發(fā)板正式面向全球市場發(fā)布。

打開網(wǎng)易新聞 查看精彩圖片

所謂開發(fā)板,就是一個開發(fā)平臺。物聯(lián)網(wǎng)技術(shù)應(yīng)用于千行百業(yè),每個行業(yè)都有不同的場景需求。因此,需要一個開發(fā)板平臺,進行行業(yè)場景下的物聯(lián)網(wǎng)終端開發(fā)技術(shù)測試和驗證。

尤其是端側(cè)AI落地,很多企業(yè)用戶都需要一個平臺,驗證大模型的能力,以及性能、功耗和兼容性表現(xiàn)。

QuecPi Alpha智能生態(tài)開發(fā)板基于高通躍龍? QCS6490處理器打造,配備8核CPU,8GB/4GB LPDDR4X內(nèi)存,AI算力高達12 TOPS。其支持Linux、Ubuntu等多種開源操作系統(tǒng),并采用高通Adreno? 642L/643 GPU,在處理圖像及視頻數(shù)據(jù)等AI計算任務(wù)時,展現(xiàn)出卓越的靈活性和高效性。

QuecPi Alpha可以說是端側(cè)AI產(chǎn)品開發(fā)的一個神器,廣泛覆蓋了AIoT行業(yè)的諸多應(yīng)用場景,如AI邊緣計算、工業(yè)機器人、服務(wù)/陪伴/教育/娛樂機器人、工控、多媒體終端、數(shù)字廣告牌、智能家居等。

以智慧交通和智能安全為例,QuecPi Alpha能夠在復(fù)雜場景下快速、精準地識別并標注車輛、車牌、行人等目標物體。它在邊緣計算、低延遲處理方面的優(yōu)異表現(xiàn),為交通管理等領(lǐng)域的實時決策提供了有力支持。

結(jié)語

根據(jù)最新數(shù)據(jù),全球端側(cè)AI設(shè)備市場規(guī)模已超過600億美元,年復(fù)合增長率(CAGR)達到22%。預(yù)計到2030年,更將超過1500億美元。

這是一個巨大的市場機遇。想要把握這個機遇,就必須在端側(cè)算力、模型適配、模型部署等方面進行深入研究和持續(xù)投入。選擇一個好的物聯(lián)網(wǎng)解決方案,顯然能夠以最短的周期推出滿足用戶體驗的產(chǎn)品,從而在激烈的市場競爭中脫穎而出。

我們期待這個市場的進一步爆發(fā),加速推動AI的落地和普及,將人類早日帶入真正的數(shù)智時代。