克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

央企通信巨頭,牽頭搞起了一個(gè)開(kāi)源社區(qū)?

而且模型、數(shù)據(jù)等各種資源應(yīng)有盡有,還有學(xué)習(xí)資料和交流空間

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這個(gè)社區(qū),就是由中國(guó)電信天翼云牽頭發(fā)起的魔樂(lè)社區(qū)(Modelers.cn)。

魔樂(lè)社區(qū)不只有在線平臺(tái),還在線下正式成立了理事會(huì),對(duì)社區(qū)進(jìn)行管理建設(shè)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而且理事會(huì)剛成立就目標(biāo)宏大,不僅要提供開(kāi)源資源,更要覆蓋串聯(lián)起AI的全產(chǎn)業(yè)鏈

央企牽頭,魔樂(lè)社區(qū)理事會(huì)正式成立

央企牽頭,魔樂(lè)社區(qū)理事會(huì)正式成立

魔樂(lè)社區(qū)是一個(gè)人工智能社區(qū),提供人工智能工具、模型、數(shù)據(jù)的托管、展示與應(yīng)用協(xié)同服務(wù),為人工智能開(kāi)發(fā)及愛(ài)好者搭建開(kāi)放的學(xué)習(xí)交流平臺(tái),能夠幫助每一位開(kāi)發(fā)者學(xué)習(xí)獲取領(lǐng)先的AI技術(shù)。

理事會(huì)是魔樂(lè)社區(qū)的管理機(jī)構(gòu),由全產(chǎn)業(yè)鏈共同建設(shè)、共同運(yùn)營(yíng)、共同享有,負(fù)責(zé)把控社區(qū)的發(fā)展方向、制定長(zhǎng)期規(guī)劃,并對(duì)具體業(yè)務(wù)提供指導(dǎo)。

首批理事會(huì)成員涵蓋AI芯片企業(yè)、模型、數(shù)據(jù)和工具企業(yè)、科研機(jī)構(gòu)及生態(tài)組織等,共計(jì)14家單位。

在遴選過(guò)程中,發(fā)起者將整個(gè)AI產(chǎn)業(yè)分為不同環(huán)節(jié)后,在每一環(huán)節(jié)中選擇具有代表性且認(rèn)可社區(qū)愿景、使命和目標(biāo),并愿意向社區(qū)持續(xù)貢獻(xiàn)的機(jī)構(gòu)協(xié)商,然后敲定名單。

最終確定的首批成員如下(按全稱拼音排序)

打開(kāi)網(wǎng)易新聞 查看精彩圖片

這些單位不僅覆蓋了AI產(chǎn)業(yè)鏈上的不同環(huán)節(jié),也包括了企業(yè)、科研單位等不同類型的機(jī)構(gòu),這些機(jī)構(gòu)將共同參與社區(qū)治理,讓社區(qū)能夠全面考量來(lái)自各個(gè)方面的關(guān)切。

未來(lái),魔樂(lè)社區(qū)還將通過(guò)理事會(huì)深化與高校、科研機(jī)構(gòu)及企業(yè)的合作,吸引更多成員加入,并深度整合技術(shù)、人才與產(chǎn)業(yè)資源。

魔樂(lè)社區(qū)理事會(huì),具體由治理、建設(shè)、運(yùn)營(yíng)三個(gè)委員會(huì),以及秘書(shū)處四個(gè)部分組成。

其中,治理委員會(huì)負(fù)責(zé)戰(zhàn)略及各類裁決,建設(shè)委員會(huì)聚焦技術(shù)標(biāo)準(zhǔn)與社區(qū)網(wǎng)站建設(shè),運(yùn)營(yíng)委員會(huì)負(fù)責(zé)各類運(yùn)營(yíng)活動(dòng),秘書(shū)處提供各類協(xié)調(diào)和支持。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

另外理事會(huì)還設(shè)立了特別興趣小組(SIG)機(jī)制。

兩名及以上有共同興趣和目標(biāo)的社區(qū)用戶,可向相關(guān)委員會(huì)提案成立SIG,針對(duì)具體問(wèn)題進(jìn)行專項(xiàng)攻關(guān)。

另外理事會(huì)還通過(guò)治理架構(gòu)和章程,設(shè)置淘汰機(jī)制,督促理事會(huì)成員積極參與社區(qū)事務(wù),避免出現(xiàn)“聚而不合”的問(wèn)題。

當(dāng)然,魔樂(lè)社區(qū)理事會(huì)也會(huì)盡力保證參與者在社區(qū)中的獲得感,從而提高成員的行動(dòng)意愿,確保社區(qū)的長(zhǎng)期運(yùn)行。

總之,理事會(huì)的成立,將為魔樂(lè)社區(qū)未來(lái)的發(fā)展提供更加堅(jiān)實(shí)的組織保障。

算力、模型、數(shù)據(jù),應(yīng)有盡有

算力、模型、數(shù)據(jù),應(yīng)有盡有

那么,魔樂(lè)社區(qū)到底能夠提供什么樣的資源呢?

首先,是各種模型、數(shù)據(jù)集、模型工具等AI開(kāi)發(fā)者常用的資源。

以模型為例,魔樂(lè)社區(qū)當(dāng)中包含了文本、圖像、音頻等各種模態(tài)(包括多模態(tài))的模型,并且還有針對(duì)不同算力設(shè)施和模型工具的優(yōu)化版本。

像DeepSeek、Qwen,還有智譜等等知名開(kāi)源模型,都被收錄在列,關(guān)鍵是這些模型還都完成了國(guó)產(chǎn)化硬件適配。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

還有開(kāi)源數(shù)據(jù),也涵蓋了多種模態(tài)和任務(wù)類型。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

甚至,魔樂(lè)社區(qū)還和算力行業(yè)成員一起,為用戶提供了公益性的免費(fèi)的國(guó)產(chǎn)化算力資源

直接體現(xiàn)就是社區(qū)中的在線體驗(yàn)空間,可以通過(guò)主流開(kāi)源SDK快速創(chuàng)建屬于自己的AI應(yīng)用,并且支持分享,讓非開(kāi)發(fā)者也能在線試玩。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

此外還聯(lián)合社區(qū)成員,在線上和線下舉辦學(xué)習(xí)交流活動(dòng),讓社區(qū)不只作AI資源的交換站,更要成為人與人之間的協(xié)作平臺(tái)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

通過(guò)魔樂(lè)社區(qū),AI行業(yè)中的一些問(wèn)題正在被解決,例如學(xué)術(shù)界擁有大量的研究成果,但面臨著學(xué)術(shù)成果難以轉(zhuǎn)化落地的窘境。

這和學(xué)術(shù)界更多關(guān)注理論研究的模式不無(wú)關(guān)聯(lián),但更重要的原因是缺乏實(shí)踐的土壤,成果難以被產(chǎn)業(yè)界關(guān)注認(rèn)可。

不過(guò)有了社區(qū)的幫助,學(xué)術(shù)成果就可以通過(guò)demo的形式更加直觀地被展現(xiàn),讓不懂AI的人都能夠看到成果的價(jià)值,從而讓成果更迅速地被認(rèn)識(shí)、認(rèn)可。

與此同時(shí),從魔樂(lè)社區(qū)中受益的不僅是學(xué)術(shù)界,還有中小企業(yè)。

硅基智能是一家AI創(chuàng)新企業(yè),目前的主攻方向是AI數(shù)字人。

其生態(tài)合作部門負(fù)責(zé)人介紹,硅基智能在數(shù)字人技術(shù)本身已經(jīng)擁有了優(yōu)秀的成果,但在此之外,負(fù)責(zé)為其數(shù)字人提供語(yǔ)言內(nèi)容的大模型,卻并非其強(qiáng)項(xiàng)。

開(kāi)源社區(qū)中的語(yǔ)言模型,就可以很好地彌補(bǔ)這一不足,幫助其完善整個(gè)產(chǎn)品鏈條。

享受開(kāi)源模型帶來(lái)的便利的同時(shí),硅基智能也將其擁有的數(shù)字人技術(shù)貢獻(xiàn)出來(lái),供其他開(kāi)發(fā)者使用,同時(shí)獲得使用者的反饋意見(jiàn),形成正向循環(huán)。

從這兩個(gè)例子當(dāng)中,可以看到魔樂(lè)社區(qū)確實(shí)在產(chǎn)學(xué)研之間架起了橋梁,起到了帶動(dòng)整個(gè)產(chǎn)業(yè)協(xié)同發(fā)展的關(guān)鍵作用。

未來(lái),魔樂(lè)社區(qū)還將考慮與高校進(jìn)行聯(lián)合人才培養(yǎng),讓開(kāi)源社區(qū)的版圖進(jìn)一步擴(kuò)大。

為什么要有魔樂(lè),GitHub不香嗎?

為什么要有魔樂(lè),GitHub不香嗎?

那么,在國(guó)內(nèi)外都已經(jīng)不缺開(kāi)源社區(qū)的情況下,為什么依然需要一個(gè)魔樂(lè)呢?

第一個(gè)原因,是現(xiàn)有開(kāi)源社區(qū)——特別是AI開(kāi)源社區(qū)——開(kāi)放性依然存在不足

眾所周知,GitHub是全球最大的開(kāi)源代碼倉(cāng)庫(kù)。

但在大模型時(shí)代,GitHub未能及時(shí)有效地提供模型權(quán)重和數(shù)據(jù)集的開(kāi)源土壤,于是誕生出了Hugging Face這一模型平臺(tái)。

Hugging Face雖然是模型開(kāi)發(fā)者的不二之選,但到了實(shí)際應(yīng)用環(huán)節(jié),依然有一部分需求無(wú)法通過(guò)Hugging Face得到解決。

基礎(chǔ)模型在實(shí)際應(yīng)用之前,需要和模型工具進(jìn)行適配,實(shí)際場(chǎng)景中的模型工具多種多樣,但Hugging Face目前主要支持的還是自己的工具。

這一現(xiàn)象,也引起了部分開(kāi)發(fā)者對(duì)其開(kāi)放性產(chǎn)生了懷疑。

另一方面,開(kāi)源模型、數(shù)據(jù)、工具未形成良性協(xié)同,比如開(kāi)源模型的作者,更關(guān)注如何訓(xùn)練出模型,而不會(huì)去考慮適配不同的異構(gòu)化算力和模型工具。

這種局面的直接原因是不同領(lǐng)域之間的開(kāi)源主體缺乏有效協(xié)同,往往是自掃門前雪。

但并非所有開(kāi)源主體都有雄厚實(shí)力,能夠?qū)⒊晒_(kāi)源已經(jīng)是值得鼓勵(lì)的事,不能也不應(yīng)該對(duì)開(kāi)發(fā)者在適配工作中出現(xiàn)的不足進(jìn)行苛責(zé)。

當(dāng)然,問(wèn)題也客觀存在,因此需要想其他辦法去解決這個(gè)問(wèn)題,就需要有人在中間環(huán)節(jié)當(dāng)中承擔(dān)統(tǒng)籌調(diào)度的職責(zé)。

第三,隨著人類在開(kāi)源道路上的腳步不斷前進(jìn),一些具體的問(wèn)題也開(kāi)始逐漸顯現(xiàn)

以數(shù)據(jù)為例,目前數(shù)據(jù)的版權(quán)、所有權(quán)、傳播權(quán)等均存在爭(zhēng)議,且數(shù)據(jù)開(kāi)源與商業(yè)化之間存在博弈,無(wú)法通過(guò)現(xiàn)有開(kāi)源協(xié)議得到完全解決。

除了正向的訓(xùn)練數(shù)據(jù)之外,大模型安全還需要一些敏感數(shù)據(jù),但這些數(shù)據(jù)又不宜公開(kāi)傳播,因此成為了開(kāi)源面臨的一個(gè)新困境。

而魔樂(lè)社區(qū)的出現(xiàn),正是力求解決這些困境。

首先在開(kāi)放性上,魔樂(lè)社區(qū)堅(jiān)持中立和公益的原則,對(duì)所有類型的算力、模型、工具和數(shù)據(jù)都敞開(kāi)懷抱,而不是做成云服務(wù)商的附屬。

另外還可以組織不同環(huán)節(jié)上的開(kāi)發(fā)者共同對(duì)項(xiàng)目進(jìn)行完善建設(shè),用社區(qū)的力量解決單個(gè)開(kāi)發(fā)者無(wú)力完成的協(xié)調(diào)適配工作。

開(kāi)發(fā)者在開(kāi)源工作中面臨的現(xiàn)實(shí)問(wèn)題,也可以通過(guò)社區(qū)進(jìn)行整理匯總,形成更高屋建瓴的行業(yè)洞察,再通過(guò)社區(qū)力量,與整個(gè)社會(huì)更好地協(xié)調(diào)、解決問(wèn)題。

所以,在已經(jīng)有了GitHub、Hugging Face,以及國(guó)內(nèi)開(kāi)源平臺(tái)的情況下,依然需要一個(gè)魔樂(lè)這樣能夠串聯(lián)協(xié)調(diào)整個(gè)產(chǎn)業(yè)鏈的強(qiáng)有力組織者。

未來(lái)的魔樂(lè)社區(qū),將持續(xù)匯聚人工智能全產(chǎn)業(yè)鏈力量,構(gòu)建開(kāi)放、協(xié)同、包容的AI生態(tài),加速國(guó)產(chǎn)人工智能技術(shù)的創(chuàng)新與落地。

魔樂(lè)社區(qū)地址:
https://modelers.cn/