• 克雷西 發(fā)自 凹非寺
    量子位 | 公眾號 QbitAI

央企通信巨頭,牽頭搞起了一個開源社區(qū)?

而且模型、數(shù)據(jù)等各種資源應(yīng)有盡有,還有學(xué)習(xí)資料和交流空間

打開網(wǎng)易新聞 查看精彩圖片

這個社區(qū),就是由中國電信天翼云牽頭發(fā)起的魔樂社區(qū)(Modelers.cn)。

魔樂社區(qū)不只有在線平臺,還在線下正式成立了理事會,對社區(qū)進(jìn)行管理建設(shè)。

打開網(wǎng)易新聞 查看精彩圖片

而且理事會剛成立就目標(biāo)宏大,不僅要提供開源資源,更要覆蓋串聯(lián)起AI的全產(chǎn)業(yè)鏈

央企牽頭,魔樂社區(qū)理事會正式成立

央企牽頭,魔樂社區(qū)理事會正式成立

魔樂社區(qū)是一個人工智能社區(qū),提供人工智能工具、模型、數(shù)據(jù)的托管、展示與應(yīng)用協(xié)同服務(wù),為人工智能開發(fā)及愛好者搭建開放的學(xué)習(xí)交流平臺,能夠幫助每一位開發(fā)者學(xué)習(xí)獲取領(lǐng)先的AI技術(shù)。

理事會是魔樂社區(qū)的管理機(jī)構(gòu),由全產(chǎn)業(yè)鏈共同建設(shè)、共同運(yùn)營、共同享有,負(fù)責(zé)把控社區(qū)的發(fā)展方向、制定長期規(guī)劃,并對具體業(yè)務(wù)提供指導(dǎo)。

首批理事會成員涵蓋AI芯片企業(yè)、模型、數(shù)據(jù)和工具企業(yè)、科研機(jī)構(gòu)及生態(tài)組織等,共計14家單位。

在遴選過程中,發(fā)起者將整個AI產(chǎn)業(yè)分為不同環(huán)節(jié)后,在每一環(huán)節(jié)中選擇具有代表性且認(rèn)可社區(qū)愿景、使命和目標(biāo),并愿意向社區(qū)持續(xù)貢獻(xiàn)的機(jī)構(gòu)協(xié)商,然后敲定名單。

最終確定的首批成員如下(按全稱拼音排序)

打開網(wǎng)易新聞 查看精彩圖片

這些單位不僅覆蓋了AI產(chǎn)業(yè)鏈上的不同環(huán)節(jié),也包括了企業(yè)、科研單位等不同類型的機(jī)構(gòu),這些機(jī)構(gòu)將共同參與社區(qū)治理,讓社區(qū)能夠全面考量來自各個方面的關(guān)切。

未來,魔樂社區(qū)還將通過理事會深化與高校、科研機(jī)構(gòu)及企業(yè)的合作,吸引更多成員加入,并深度整合技術(shù)、人才與產(chǎn)業(yè)資源。

魔樂社區(qū)理事會,具體由治理、建設(shè)、運(yùn)營三個委員會,以及秘書處四個部分組成。

其中,治理委員會負(fù)責(zé)戰(zhàn)略及各類裁決,建設(shè)委員會聚焦技術(shù)標(biāo)準(zhǔn)與社區(qū)網(wǎng)站建設(shè),運(yùn)營委員會負(fù)責(zé)各類運(yùn)營活動,秘書處提供各類協(xié)調(diào)和支持。

打開網(wǎng)易新聞 查看精彩圖片

另外理事會還設(shè)立了特別興趣小組(SIG)機(jī)制。

兩名及以上有共同興趣和目標(biāo)的社區(qū)用戶,可向相關(guān)委員會提案成立SIG,針對具體問題進(jìn)行專項攻關(guān)。

另外理事會還通過治理架構(gòu)和章程,設(shè)置淘汰機(jī)制,督促理事會成員積極參與社區(qū)事務(wù),避免出現(xiàn)“聚而不合”的問題。

當(dāng)然,魔樂社區(qū)理事會也會盡力保證參與者在社區(qū)中的獲得感,從而提高成員的行動意愿,確保社區(qū)的長期運(yùn)行。

總之,理事會的成立,將為魔樂社區(qū)未來的發(fā)展提供更加堅實(shí)的組織保障。

算力、模型、數(shù)據(jù),應(yīng)有盡有

算力、模型、數(shù)據(jù),應(yīng)有盡有

那么,魔樂社區(qū)到底能夠提供什么樣的資源呢?

首先,是各種模型、數(shù)據(jù)集、模型工具等AI開發(fā)者常用的資源。

以模型為例,魔樂社區(qū)當(dāng)中包含了文本、圖像、音頻等各種模態(tài)(包括多模態(tài))的模型,并且還有針對不同算力設(shè)施和模型工具的優(yōu)化版本。

像DeepSeek、Qwen,還有智譜等等知名開源模型,都被收錄在列,關(guān)鍵是這些模型還都完成了國產(chǎn)化硬件適配。

打開網(wǎng)易新聞 查看精彩圖片

還有開源數(shù)據(jù),也涵蓋了多種模態(tài)和任務(wù)類型。

打開網(wǎng)易新聞 查看精彩圖片

甚至,魔樂社區(qū)還和算力行業(yè)成員一起,為用戶提供了公益性的免費(fèi)的國產(chǎn)化算力資源

直接體現(xiàn)就是社區(qū)中的在線體驗空間,可以通過主流開源SDK快速創(chuàng)建屬于自己的AI應(yīng)用,并且支持分享,讓非開發(fā)者也能在線試玩。

打開網(wǎng)易新聞 查看精彩圖片

此外還聯(lián)合社區(qū)成員,在線上和線下舉辦學(xué)習(xí)交流活動,讓社區(qū)不只作AI資源的交換站,更要成為人與人之間的協(xié)作平臺。

打開網(wǎng)易新聞 查看精彩圖片

舉個例子,上海AI實(shí)驗室是學(xué)術(shù)界的一個重要代表,擁有大量的研究成果,但同樣面臨著學(xué)術(shù)成果難以轉(zhuǎn)化落地的窘境。

這和學(xué)術(shù)界更多關(guān)注理論研究的模式不無關(guān)聯(lián),但更重要的原因是缺乏實(shí)踐的土壤,成果難以被產(chǎn)業(yè)界關(guān)注認(rèn)可。

不過有了社區(qū)的幫助,學(xué)術(shù)成果就可以通過demo的形式更加直觀地被展現(xiàn),讓不懂AI的人都能夠看到成果的價值,從而讓成果更迅速地被認(rèn)識、認(rèn)可。

所以,上海AI實(shí)驗室積極與魔樂社區(qū)合作,貢獻(xiàn)了大量的模型和數(shù)據(jù)資源,同時其下屬的OpenDataLab也以理事會成員的身份加入了社區(qū),積極投身到了社區(qū)建設(shè)中。

與此同時,從魔樂社區(qū)中受益的不僅是學(xué)術(shù)界,還有中小企業(yè)。

硅基智能是一家AI創(chuàng)新企業(yè),目前的主攻方向是AI數(shù)字人。

其生態(tài)合作部門負(fù)責(zé)人介紹,硅基智能在數(shù)字人技術(shù)本身已經(jīng)擁有了優(yōu)秀的成果,但在此之外,負(fù)責(zé)為其數(shù)字人提供語言內(nèi)容的大模型,卻并非其強(qiáng)項。

開源社區(qū)中的語言模型,就可以很好地彌補(bǔ)這一不足,幫助其完善整個產(chǎn)品鏈條。

享受開源模型帶來的便利的同時,硅基智能也將其擁有的數(shù)字人技術(shù)貢獻(xiàn)出來,供其他開發(fā)者使用,同時獲得使用者的反饋意見,形成正向循環(huán)。

從這兩個例子當(dāng)中,可以看到魔樂社區(qū)確實(shí)在產(chǎn)學(xué)研之間架起了橋梁,起到了帶動整個產(chǎn)業(yè)協(xié)同發(fā)展的關(guān)鍵作用。

未來,魔樂社區(qū)還將考慮與高校進(jìn)行聯(lián)合人才培養(yǎng),讓開源社區(qū)的版圖進(jìn)一步擴(kuò)大。

為什么要有魔樂,GitHub不香嗎?

為什么要有魔樂,GitHub不香嗎?

那么,在國內(nèi)外都已經(jīng)不缺開源社區(qū)的情況下,為什么依然需要一個魔樂呢?

第一個原因,是現(xiàn)有開源社區(qū)——特別是AI開源社區(qū)——開放性依然存在不足

眾所周知,GitHub是全球最大的開源代碼倉庫。

但在大模型時代,GitHub未能及時有效地提供模型權(quán)重和數(shù)據(jù)集的開源土壤,于是誕生出了Hugging Face這一模型平臺。

Hugging Face雖然是模型開發(fā)者的不二之選,但到了實(shí)際應(yīng)用環(huán)節(jié),依然有一部分需求無法通過Hugging Face得到解決。

基礎(chǔ)模型在實(shí)際應(yīng)用之前,需要和模型工具進(jìn)行適配,實(shí)際場景中的模型工具多種多樣,但Hugging Face目前主要支持的還是自己的工具。

這一現(xiàn)象,也引起了部分開發(fā)者對其開放性產(chǎn)生了懷疑。

另一方面,開源模型、數(shù)據(jù)、工具未形成良性協(xié)同,比如開源模型的作者,更關(guān)注如何訓(xùn)練出模型,而不會去考慮適配不同的異構(gòu)化算力和模型工具。

這種局面的直接原因是不同領(lǐng)域之間的開源主體缺乏有效協(xié)同,往往是自掃門前雪。

但并非所有開源主體都有雄厚實(shí)力,能夠?qū)⒊晒_源已經(jīng)是值得鼓勵的事,不能也不應(yīng)該對開發(fā)者在適配工作中出現(xiàn)的不足進(jìn)行苛責(zé)。

當(dāng)然,問題也客觀存在,因此需要想其他辦法去解決這個問題,就需要有人在中間環(huán)節(jié)當(dāng)中承擔(dān)統(tǒng)籌調(diào)度的職責(zé)。

第三,隨著人類在開源道路上的腳步不斷前進(jìn),一些具體的問題也開始逐漸顯現(xiàn)

以數(shù)據(jù)為例,目前數(shù)據(jù)的版權(quán)、所有權(quán)、傳播權(quán)等均存在爭議,且數(shù)據(jù)開源與商業(yè)化之間存在博弈,無法通過現(xiàn)有開源協(xié)議得到完全解決。

除了正向的訓(xùn)練數(shù)據(jù)之外,大模型安全還需要一些敏感數(shù)據(jù),但這些數(shù)據(jù)又不宜公開傳播,因此成為了開源面臨的一個新困境。

而魔樂社區(qū)的出現(xiàn),正是力求解決這些困境。

首先在開放性上,魔樂社區(qū)堅持中立和公益的原則,對所有類型的算力、模型、工具和數(shù)據(jù)都敞開懷抱,而不是做成云服務(wù)商的附屬。

另外還可以組織不同環(huán)節(jié)上的開發(fā)者共同對項目進(jìn)行完善建設(shè),用社區(qū)的力量解決單個開發(fā)者無力完成的協(xié)調(diào)適配工作。

開發(fā)者在開源工作中面臨的現(xiàn)實(shí)問題,也可以通過社區(qū)進(jìn)行整理匯總,形成更高屋建瓴的行業(yè)洞察,再通過社區(qū)力量,與整個社會更好地協(xié)調(diào)、解決問題。

所以,在已經(jīng)有了GitHub、Hugging Face,以及國內(nèi)開源平臺的情況下,依然需要一個魔樂這樣能夠串聯(lián)協(xié)調(diào)整個產(chǎn)業(yè)鏈的強(qiáng)有力組織者。

未來的魔樂社區(qū),將持續(xù)匯聚人工智能全產(chǎn)業(yè)鏈力量,構(gòu)建開放、協(xié)同、包容的AI生態(tài),加速國產(chǎn)人工智能技術(shù)的創(chuàng)新與落地。

魔樂社區(qū)地址:
https://modelers.cn/