
DeepSeek對全世界的改變都是非常巨大的,尤其是對大模型的一種重新審視,對算力和算法的重新匹配讓科技企業(yè)開始了深度思考。而且,開源的DeepSeek也讓OpenAI感到了壓力,后續(xù)OpenAI也開始了自己的免費之旅。國內(nèi)市場也有相應的免費推介,這都應該歸功于DeepSeek推出帶來的改變。
科技巨頭相繼接入DeepSeek也是對這種算法的認可。由于DeepSeek的努力讓市場的認知也發(fā)生了改變。近日,我們看到馬斯克也在宣布自己的大模型即將推出了迭代版。Grok3即將推出。馬斯克表示,最新大模型Grok 3將于太平洋時間周一晚上8點發(fā)布,屆時將進行現(xiàn)場演示。
如果僅僅是一個產(chǎn)品的升級還無法達到什么效應,不過,馬斯克的高明之處,就是極好地利用各種展現(xiàn)的時候給自己做廣告了。馬斯克表示:“Grok 3具有極強推理能力,在我們迄今為止所做的測試中,其表現(xiàn)優(yōu)于我們所知的任何已發(fā)布產(chǎn)品?!币簿褪钦f,馬斯克認為自己的產(chǎn)品會比ChatGPT、DeepSeek的推理能力更強,言外之意就是自己的Grok3更強大了。
那么,是不是Grok3就是“地球上最聰明的AI”?估計也只有發(fā)布之后才能驗證了。熟悉大模型的用戶都知道,Grok大模型是馬斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI發(fā)布第一款大模型Grok-1,邁出了在大模型領域探索的第一步。2024年3月18日,xAI團隊又推出了參數(shù)量高達3140億的Grok-1模型,這一參數(shù)量遠超OpenAI GPT-3.5的1750億,成為當時參數(shù)量最大的開源大語言模型。
2024年8月,Grok 2大模型發(fā)布 。Grok2主要應用于訓練AI聊天機器人。與Grok 1相比,它在訓練數(shù)據(jù)的使用上有所改進。Grok 1在訓練時未完全依賴真實世界數(shù)據(jù),采用了大量合成數(shù)據(jù),導致在處理真實世界中的細微差別和復雜性時表現(xiàn)欠佳。而Grok 2雖然依舊使用了大規(guī)模合成數(shù)據(jù)集,但同時融入了少量高質(zhì)量的真實世界數(shù)據(jù),在一定程度上彌補了初代模型在處理真實場景方面的不足。
據(jù)悉,即將發(fā)布的Grok 3,其最大的特點在于引入了“思維鏈”(Chain Of Thought)推理能力。該能力讓Grok 3能夠像人類認知過程一樣逐步處理復雜任務,顯著提高了模型處理復雜查詢和提供更連貫、更有邏輯的響應的能力。Grok 3模型在推理、編程能力以及文本和圖像分析等多模態(tài)功能方面有了顯著的提升。
馬斯克還表示,Grok 3已完成預訓練,其計算量比Grok 2高10倍。眾所周知,馬斯克一直扮演著追趕OpenAI的步伐,如今顯然又增加了DeepSeek了。在DeepSeek剛推出的時候,馬斯克表達了認可。不過,其也表示,xAI將會推出“比DeepSeek更強大的模型”。Grok 3無疑就要扮演這樣的角色。馬斯克表示,大模型市場真正的“革命”需依賴更底層技術的突破(如多模態(tài)融合、生成式AI的深度應用)。
眾所周知,DeepSeek的“低價高能”模式可能推動大模型商業(yè)化落地,但馬斯克認為真正的變革需技術質(zhì)變,而非單純優(yōu)化。其實,當一種低價高能在某些應用方面開始落地的時候,這時候就是算法的突出性,對于算力達不到的企業(yè)來說,一樣可以布局自己的專業(yè)化的大模型應用,這才是最關鍵的。而且,這也暗示了全球AI競賽的激烈程度將持續(xù)升級。
熱門跟貼