2025 年 4 月 10 - 12 日,QCon 全球軟件開(kāi)發(fā)大會(huì)將匯聚全球 140+ 技術(shù)先行者及創(chuàng)新實(shí)踐者,直擊行業(yè)痛點(diǎn),解鎖可復(fù)制的經(jīng)驗(yàn)與模式。這不僅是一場(chǎng)會(huì)議,更是一次對(duì)技術(shù)演進(jìn)的集體探索。無(wú)論你是資深開(kāi)發(fā)者,還是技術(shù)管理者,都能在這里有所收獲,為下一步的技術(shù)決策提供方向。
小紅書(shū)混合云資源管理負(fù)責(zé)人梁?jiǎn)⒊梢汛_認(rèn)出席并發(fā)表題為《小紅書(shū) FinOps 實(shí)踐:云成本優(yōu)化與資源效率提升之道》的主題分享。眼下,云計(jì)算已成為眾多互聯(lián)網(wǎng)企業(yè)支撐業(yè)務(wù)運(yùn)行的關(guān)鍵基礎(chǔ)設(shè)施,然而云計(jì)算的便利性和靈活性也帶來(lái)了一系列資源成本管理挑戰(zhàn),包括成本增速過(guò)快、成本歸屬不清晰、缺乏有效成本控制手段、對(duì)云廠商高度依賴(lài)等。本次分享將重點(diǎn)介紹小紅書(shū)的 FinOps 實(shí)踐經(jīng)驗(yàn),并通過(guò)技術(shù)優(yōu)化手段提升資源使用效率,每年節(jié)省數(shù)億成本。
梁?jiǎn)⒊啥嗄?IT 資源管理與成本優(yōu)化經(jīng)驗(yàn),曾深度參與頭部互聯(lián)網(wǎng)企業(yè)上云、大規(guī)模在離線業(yè)務(wù)混部,并持續(xù)推進(jìn)業(yè)財(cái)一體化以及精細(xì)化的混合云資源成本管理,2024 年參與了信通院《IT 基礎(chǔ)設(shè)施資源運(yùn)營(yíng)成熟度模型》標(biāo)準(zhǔn)制定,是 FinOps 文化的踐行者。他在本次會(huì)議的詳細(xì)演講內(nèi)容如下:
演講提綱
小紅書(shū)用云概述
成本優(yōu)化面臨的問(wèn)題與挑戰(zhàn)
分?jǐn)?a class="keyword-search" >云成本與實(shí)際資源用量存在偏差
資源規(guī)模不斷增長(zhǎng)但利用效率持續(xù)低下
大模型的部署與運(yùn)行成本高昂
成本洞察與優(yōu)化實(shí)踐
技術(shù)商品化實(shí)現(xiàn)內(nèi)外賬分離
大 Node 小 Pod 策略下的在線業(yè)務(wù)混部
工作負(fù)載性能瓶頸分析
機(jī)型收斂與 RightSizing
內(nèi)容大模型的降本增效
多維并行提升訓(xùn)練效率
量化蒸餾壓縮模型大小
算子優(yōu)化提升推理速度
總結(jié)與展望
這樣的技術(shù)在實(shí)踐過(guò)程中
有哪些痛點(diǎn)?
常規(guī)按比例分賬方法能幫助測(cè)算出各業(yè)務(wù)部門(mén)的資源成本費(fèi)用,但不一定能解釋清楚其背后的量?jī)r(jià)對(duì)應(yīng)關(guān)系,進(jìn)而影響了技術(shù)優(yōu)化方向判斷。
云廠商硬件經(jīng)過(guò)虛擬化后,不同規(guī)格大小虛擬機(jī)會(huì)存在跨 numa、共用一個(gè) Socket 產(chǎn)生干擾,進(jìn)而表現(xiàn)出內(nèi)存性能差、業(yè)務(wù) CPU 使用率明顯分層、服務(wù) RT 抖動(dòng)明顯等問(wèn)題,云上客戶(hù)不得不開(kāi)通更多資源降低容量水位來(lái)保證在線服務(wù)不受損,最終造成了成本浪費(fèi)
高昂的訓(xùn)練和推理成本、高硬件需求、資源利用效率低下,這些問(wèn)題限制了內(nèi)容大模型的廣泛應(yīng)用和普及,需要通過(guò)技術(shù)創(chuàng)新和優(yōu)化策略來(lái)解決
演講亮點(diǎn)
重點(diǎn)聚焦于建立清晰、透明的成本洞察機(jī)制以及配套系統(tǒng)能力建設(shè),嘗試分別從買(mǎi)賣(mài)家視角梳理清楚各自團(tuán)隊(duì)的資源用量、技術(shù)成本支出以及收入情況
看清、看準(zhǔn)、分析出系統(tǒng)關(guān)鍵性能瓶頸,通過(guò)機(jī)型迭代、內(nèi)核優(yōu)化等措施確保各業(yè)務(wù)具備將 CPU 跑高的能力,進(jìn)而執(zhí)行縮容退機(jī)操作達(dá)到降低成本的目標(biāo)
分別從數(shù)據(jù)、訓(xùn)練、壓縮、推理等方面介紹小紅書(shū)對(duì)于內(nèi)容大模型的降本增效實(shí)踐
聽(tīng)眾收益
可以幫助相關(guān)從業(yè)人員了解或?qū)W習(xí)云成本優(yōu)化的主要技術(shù)方案,并在日常工作中進(jìn)行運(yùn)用
除此之外,本次大會(huì)還策劃了多模態(tài)大模型及應(yīng)用、AI 驅(qū)動(dòng)的工程生產(chǎn)力、面向 AI 的研發(fā)基礎(chǔ)設(shè)施、不被 AI 取代的工程師、大模型賦能 AIOps、云成本優(yōu)化、Lakehouse 架構(gòu)演進(jìn)、越挫越勇的大前端等專(zhuān)題,屆時(shí)將有來(lái)自不同行業(yè)、不同領(lǐng)域、不同企業(yè)的 100+ 資深專(zhuān)家在 QCon 北京現(xiàn)場(chǎng)帶來(lái)前沿技術(shù)洞察和一線實(shí)踐經(jīng)驗(yàn)。
目前,所有大會(huì)演講嘉賓已結(jié)集完畢,了解更多報(bào)名和詳情信息可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 咨詢(xún)。
熱門(mén)跟貼