
隨著AI浪潮的不斷迭代推進,數(shù)字行業(yè)的發(fā)展迅猛多變,數(shù)據(jù)存儲技術(shù)也正經(jīng)歷著前所未有的變革。從傳統(tǒng)的集中式存儲到如今備受矚目的分布式存儲,技術(shù)的演進不僅推動著行業(yè)變革,也催生了一批敢于突破、勇于創(chuàng)新的科技創(chuàng)業(yè)者。李小勇,上海霄云科技創(chuàng)始人,便是其中的代表人物。然而,與AI發(fā)展的“快”相比,他的創(chuàng)業(yè)卻顯得有點“慢”。正是這種以“慢”為獨特視角的行業(yè)深刻洞察和以“慢”為快的發(fā)展理念,成就了今天的上海霄云信息科技。
近日,我們有幸采訪了上海霄云信息科技創(chuàng)始人(以下簡稱:霄云科技)李小勇,聽他講述創(chuàng)業(yè)路上的“頂天立地”以及“慢愚公”如何在快時代中馳騁的創(chuàng)業(yè)故事。
真正的十年磨一劍
李小勇并不是一個投資人眼里傳統(tǒng)意義上的創(chuàng)業(yè)者,他身上帶著濃厚的學(xué)術(shù)氣息以及對于技術(shù)近乎癡迷的執(zhí)著,而故事的開始也正是始于這種對技術(shù)的熱愛和對使命的堅持。
談到創(chuàng)業(yè)初衷,李小勇則將記憶的片段帶回到了十年前,他說:“我是一名大學(xué)老師和科研人員。學(xué)術(shù)界有一個說法叫作:做科研要頂天立地。所謂“頂天”,是指研究方向要具備前沿的理論研究空間,至少是二三十年內(nèi)發(fā)展的主流;而“立地”則指需要在實踐中得到應(yīng)用。然而,當(dāng)時研究嵌入式系統(tǒng)的李小勇發(fā)現(xiàn),這一方向顯然不達標,難以實現(xiàn)“頂天立地”。因此,在不斷地摸索和機緣巧合之下,他最終選擇并專注于存儲技術(shù)研究作為發(fā)展方向。
從2010年開始的3000多個日夜,李小勇近乎瘋狂地追求著自己的夢想:不是模仿,也不是改造,而是開發(fā)一套完全自研的、高性能的分布式存儲?!胺植际酱鎯κ且粋€工作量十分龐大的工作,剛開始創(chuàng)業(yè)的時候,我們團隊人很少,都是一天當(dāng)成兩天過,睡了10年辦公室沙發(fā)”。經(jīng)過難忘的日夜奮斗,在2015年,李小勇腦海中的分布式存儲終于誕生了現(xiàn)實原型。他感慨道:“自主研發(fā)分布式存儲是一條九死一生的道路,沒有足夠的忍耐力和使命感,很難堅持下去。對于我們做存儲行業(yè)的人來說,板凳要坐十年冷”。
憑借對技術(shù)的深入理解和核心競爭力的精準洞察,李小勇堅信,只有通過自主研發(fā),才能在存儲領(lǐng)域?qū)崿F(xiàn)創(chuàng)新和真正的突破。他回憶道:“雖然讀了幾十年內(nèi)發(fā)表的相關(guān)學(xué)術(shù)論文,但紙上得來終覺淺,我們面對的技術(shù)難題猶如連綿不絕的高山,需要不斷探索、試錯。一個挑戰(zhàn)性問題往往要試錯3次以上才能探索出滿意的解決方案”。經(jīng)過十年的不懈努力,李小勇終于帶領(lǐng)團隊成功研發(fā)出擁有自主知識產(chǎn)權(quán)的分布式存儲系統(tǒng)——碧海。
然而,更大的考驗接踵而至。存儲承載著用戶的數(shù)據(jù),對可靠性要求極高。由于缺乏案例和知名度,碧海即便出世也無人問津、無人敢用。李小勇并未氣餒,他深知,市場突破需要的是找到客戶業(yè)務(wù)場景下亟待解決的關(guān)鍵掣肘和核心痛點,并解決它,讓技術(shù)創(chuàng)新的價值得到彰顯。他說道,“創(chuàng)業(yè)就像在黑暗的隧道中摸索前行,你無法預(yù)知前方是什么,但只要持續(xù)努力,光明終將到來?!倍钚∮?,也終于等來了在醫(yī)療行業(yè)中碧海得以大顯身手的機會。
碧海斬蒼穹
機會總是留給有準備的人。對于李小勇來說,十年的時間,看似漫長,但是卻成就了碧海穩(wěn)健的性能和應(yīng)對技術(shù)和市場考驗的充足準備。
海量小文件一直是全球存儲難題,而在醫(yī)療行業(yè)這個難題尤為突出。醫(yī)院為患者拍攝一張胸部CT,可能產(chǎn)生3000 ~ 10000張圖片,門診醫(yī)生想要調(diào)取一張圖片,少則3~4分鐘,多則5~6分鐘,效率極其低下,全國普遍如此。
面對這一場景應(yīng)用痛點,李小勇迅速找到癥結(jié)所在:醫(yī)院PACS調(diào)圖的速度是傳統(tǒng)存儲的性能上限,瓶頸就在存儲上,而碧海恰好可以解決這個最為迫切的困境。對于李小勇來說,等待多年的機會在這一刻終于來了。
碧海是霄云科技的旗艦產(chǎn)品,也是李小勇及其團隊在分布式存儲領(lǐng)域多年技術(shù)積累的結(jié)晶。碧海分布式存儲系統(tǒng)采用了先進的分布式架構(gòu),能夠高效地處理海量數(shù)據(jù),滿足不同場景下的存儲需求。李小勇自豪地介紹:“碧海的核心優(yōu)勢在于其高性能、高可靠性和高擴展性。業(yè)界領(lǐng)先的i/o引擎保證了高性能,獨創(chuàng)的流控技術(shù)保證了重負載高并發(fā)場景下的性能穩(wěn)定,小文件聚合優(yōu)化解決了海量小文件痛點,創(chuàng)新的數(shù)據(jù)布局算法保證了系統(tǒng)具有良好的可擴展性和動態(tài)擴容,這套組合拳終于解決了醫(yī)療行業(yè)海量小文件存儲的痛點”。

在技術(shù)層面,碧海采用了多項創(chuàng)新技術(shù)。它通過優(yōu)化數(shù)據(jù)分布算法,實現(xiàn)了數(shù)據(jù)的高效存儲和快速訪問。同時,碧海還支持多種存儲介質(zhì),包括全閃存、機械盤等,能夠根據(jù)用戶的實際需求靈活配置,實現(xiàn)數(shù)據(jù)冷熱分層。李小勇強調(diào):“在存儲領(lǐng)域,性能和可靠性是至關(guān)重要的。碧海通過先進的技術(shù)架構(gòu)和算法,確保了數(shù)據(jù)的快速讀寫和高可靠性。無論是在金融行業(yè)還是醫(yī)療領(lǐng)域,碧海都能滿足用戶對存儲系統(tǒng)的嚴苛要求?!?/p>
李小勇表示,醫(yī)療行業(yè)對數(shù)據(jù)存儲的需求極高。一方面,醫(yī)療影像數(shù)據(jù)量巨大,對存儲系統(tǒng)的性能和可擴展能力要求極高;另一方面,醫(yī)療數(shù)據(jù)的可靠性和安全性至關(guān)重要,不允許發(fā)生數(shù)據(jù)丟失和宕機問題。
碧海針對醫(yī)療行業(yè)的特點進行深度優(yōu)化,能夠高效地存儲和管理海量的醫(yī)療影像數(shù)據(jù),同時保證數(shù)據(jù)的安全性。上海市胸科醫(yī)院上線使用碧海存儲系統(tǒng)之后,醫(yī)生調(diào)閱影像的速度從原來的幾分鐘提升到了幾秒內(nèi)完成。目前,該存儲系統(tǒng)已上線五年,擴容四次,在線數(shù)據(jù)總量近600 TB,文件數(shù)高達16.9億。在這個之前被國際高端存儲壟斷的領(lǐng)域,實現(xiàn)了技術(shù)超越與國產(chǎn)化替代,創(chuàng)造了多項業(yè)界記錄。
有了這一成功實踐,霄云科技又幫助醫(yī)院解決了另外一個痛點,那就是數(shù)據(jù)遷移。通過全面調(diào)研,霄云科技自研了一套高性能遷移工具,以業(yè)內(nèi)常規(guī)的400 TB數(shù)據(jù)為例,將原本2~3年的遷移工作時間,壓縮到目前的1~3個月時間完成,大幅提升了遷移工作的進度和成效。

除了技術(shù)優(yōu)勢,碧海在產(chǎn)品設(shè)計上也充分考慮了用戶體驗,采用了簡潔的用戶界面和靈活的配置方式,方便用戶進行操作和管理。李小勇認為,一個好的產(chǎn)品不僅要具備強大的技術(shù)性能,還要像iPad那樣美觀、簡單、易用。界面設(shè)計要實現(xiàn)功能和審美相結(jié)合,人機交互要符合用戶的直覺。要讓使用產(chǎn)品成為一種享受,而不是考驗和折磨。
李小勇說:“技術(shù)是基礎(chǔ),服務(wù)是上層建筑。在新技術(shù)剛出現(xiàn)時,技術(shù)更加重要;然而在技術(shù)相對成熟的末期,技術(shù)產(chǎn)品高度同質(zhì)化時,服務(wù)就顯得更加重要。我們始終將產(chǎn)品技術(shù)領(lǐng)先和貼心服務(wù)作為核心優(yōu)勢,這也是多年來碧海一直能牢牢占據(jù)用戶心智的關(guān)鍵所在”。
截至目前,霄云科技的碧海產(chǎn)品,在上海市的醫(yī)療復(fù)購率為65.2%,在全國的存儲復(fù)購率為42.8%;全國百強醫(yī)院中,霄云科技合作已經(jīng)超20家,行業(yè)滲透率排名前列;在分布式存儲市場醫(yī)療行業(yè)細分賽道中,霄云科技排名第一。除了醫(yī)療行業(yè),霄云科技的觸角也已經(jīng)遍及金融、政務(wù)、教育等多個行業(yè)。
AI存儲,未來的星辰大海
在李小勇眼中,AI存儲是霄云科技的星辰大海。隨著人工智能的浪潮洶涌而來,數(shù)據(jù)存儲技術(shù)也正站在變革的風(fēng)口浪尖。AI的發(fā)展,如同一場前所未有的數(shù)字革命,它對數(shù)據(jù)存儲的需求,不僅僅是容量的擴張,更是性能的飛躍和可靠性的極致追求。
李小勇說:“AI時代需要全新的高性能存儲”。在AI的世界里,數(shù)據(jù)如同浩瀚星辰,體量龐大,類型多樣。AI訓(xùn)練需要處理的數(shù)據(jù)量,已經(jīng)從TB級邁向了PB級,甚至更高。這些數(shù)據(jù)不僅僅是簡單的數(shù)字,更是圖像、是語音、是文本,是各種各樣的信息碎片。這就要求存儲系統(tǒng)必須具備強大的容量和擴展性,能夠像一個巨大的“數(shù)據(jù)倉庫”,隨時接納源源不斷涌入的數(shù)據(jù)。
“但僅僅有容量是不夠的。”李小勇補充道。AI訓(xùn)練和推理對存儲系統(tǒng)的性能極高,超過傳統(tǒng)的高性能計算(HPC),GPU速度極快,成本高昂,需要性能能夠與之匹配的分布式全閃文件存儲,這也是未來3~5年分布式存儲的趨勢所向。
“AI存儲,和HPC不同,有更廣泛的應(yīng)用,會普及到千行百業(yè),其配套的存儲系統(tǒng)必須高度產(chǎn)品化,穩(wěn)定,簡單易用,傳統(tǒng)面向HPC的存儲并未達到該要求”,李小勇說。他堅信,隨著AI技術(shù)的不斷發(fā)展,數(shù)據(jù)存儲領(lǐng)域?qū)⒂瓉砀嗟臋C遇和挑戰(zhàn)。霄云科技將繼續(xù)深耕存儲技術(shù),為了滿足AI這樣的需求而積極地努力,致力于打造更加高效、可靠的AI存儲系統(tǒng)。
李小勇的眼中,AI存儲的明天,是無盡星河,是浩瀚汪洋。這片大海中,既有技術(shù)的波濤洶涌,也有市場的風(fēng)云變幻。霄云科技將在這片大海中,以技術(shù)創(chuàng)新為帆,以市場需求為導(dǎo)向,勇敢地航行。他們將用十年磨一劍的精神,繼續(xù)打磨產(chǎn)品,提升性能,優(yōu)化用戶體驗。他們相信,只要堅持不懈,終將在AI存儲的星辰大海中,找到屬于霄云科技的那片璀璨星空。
熱門跟貼